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本 书 从 易 用 性 角度 介绍 了 Python 编程 ， 分 为 Python 基本 内 容 和 高 级 话题 两 
大 部 分 。 其 中 ， 基 本 内 容 主要 包括 Python 数据 类 型 、 控 制 流程 、 文 件 、 类 、 模 块 、 
网 络 编程 、 正 则 表达 式 、GUI 和 数据 库 访问 等 ;在 每 一 章 的 基本 内 容 基础 上 加 以 
延伸 ,引出 对 应 的 高 级 话题 , 分 别 介 绍 了 Matplotlib、NumPy、 SciPy、 Flask、PyQt、 
ORM 等 优秀 的 Python TAFEL. 最 后 介绍 了 大 数据 常用 工具 (JSON、XML、 HDF5, 
pandas) 。 本 书 是 以 即 学 即 用 的 方式 进行 讲解 的 ， 读 者 可 在 每 章 学 习 之 后 应 用 该 
章 的 知识 解决 实际 工作 中 的 问题 。 
本 书 适合 Python 初学 者 、Web 软件 开发 人 员 及 数据 分 析 工 程 师 ， 也 适 
等 院 校 的 计算 机 教学 。 
书 中 的 实例 代码 〈 分 别针 对 Python 2 和 了 Python 3) 可 在 http:/www.cmpbook. 
com 下 载 。 
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出 版 说 明 


随 着 信息 科学 与 技术 的 迅速 发 展 ， 人 类 每 时 每 刻 都 会 面 对 层 出 不 穷 的 新 技术 和 新 概念 。 
毫 无 疑问 ， 在 节奏 越 来 越 快 的 工作 和 生活 中 ， 人 们 需要 通过 阅读 和 学 习 大 量 信息 丰富 、 具 备 
实践 指导 意义 的 图 书 来 获取 新 知识 和 新 技能 ， 从 而 不 断 提高 自身 素质 ， 紧 跟 信息 化 时 代 发 展 
的 步伐 。 

众所周知 ， 在 计算 机 硬件 方面 ， 高 性 价 比 的 解决 方案 和 新 型 技术 的 应 用 一 直 备 受 青 号 
在 软件 技术 方面 ， 随 着 计算 机 软件 的 规模 和 复杂 性 与 日 俱 增 ， 软 件 技术 不 断 地 受到 挑战 ， 人 
们 一 直 在 为 寻求 更 先进 的 软件 技术 而 奋斗 不 止 。 目 前 ， 计 算 机 和 互联 网 在 社会 生活 中 日 益 普 
及 ， 掌 握 计算 机 网 络 技术 和 理论 已 成 为 大 众 的 文化 需求 。 由 于 信息 科学 与 技术 在 电工 、 电 子 、 
通信 、 工 业 控制 、 智 能 建筑 、 工 业 产品 设计 与 制造 等 专业 领域 中 已 经 得 到 充分 、 广 泛 的 应 用 ， 
所 以 这 些 专业 领域 中 的 研究 人 员 和 工程 技术 人 员 越 来 越 扎 切 需要 汲取 自身 领域 信息 化 所 带 来 
的 新 理念 和 新 方法 。 
针对 人 们 了 解 和 掌握 新 知识 、 新 技能 的 热切 期 待 ， 以 及 由 此 促成 的 人 们 对 语言 简洁 、 内 
容 充 实 、 融 合 实践 经 验 的 图 书 迫 切 需要 的 现状 ， 机 械 工业 出 版 社 适 时 推出 了 “信息 科学 与 技 
RAB”. 这 套 从 书 涉及 计算 机 软件 、 硬件、 网 络 和 工程 应 用 等 内 容 , 注重 理论 与 实践 的 结合 ， 
内 容 实用 、 层 次 分 明 、 语 言 流畅 ， 是 信息 科学 与 技术 领域 专业 人 员 不 可 或 缺 的 参考 书 。 

目前 ， 信 息 科学 与 技术 的 发 展 可 谓 一 日 千里 ， 机 械 工业 出 版 社 欢迎 从 事 信息 技术 方面 工 
作 的 科研 人 员 、 工 程 技术 人 员 积极 参与 我 们 的 工作 ， 为 推进 我 国 的 信息 化 建设 做 出 贡献 。 
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Python 是 一 种 面向 对 象 、 解 释 型 计算 机 程序 设计 语言 ， 其 语法 简洁 清晰 、 易 于 学 习 ， 几 
乎 可 以 在 所 有 的 操作 系统 下 运行 。Python 常 被 称 为 “胶水 ”语言 ， 因 为 它 能 够 把 不 同 语言 编 
写 的 各 个 模块 轻松 地 组 织 在 一 起 ， 例 如 将 众多 优秀 的 Fortran 和 C 语言 库 集 成 到 Pyhton 环境 
下 ， 帮 助 开 发 者 处 理 各 种 工作 。Python 的 优秀 特性 决定 了 其 在 实际 应 用 中 的 广泛 性 ， 在 很 多 
领域 如 快速 原型 开发 、 网 络 服务 器 脚本 、 科 学 计算 、 文 本 处 理 、 数 据 库 编程 、 嵌 入 开发 、GUI 
开发 、 游 戏 开 发 和 移动 开发 中 均 有 广泛 应 用 。 


目前 Python 语言 越 来 越 受 到 重视 ， 并 已 有 大 量 成 功 的 案例 ， 如 YouTube MAE W 
XH. WX 〈 社 区 网 站 )、OpenStack〈 云 计算 平台 ) 和 Tornado (Web 服务 器 ) 等 都 是 基 


Python 开发 的 。 

本 书 既 介 绍 了 Python 的 基础 知识 ， 也 介绍 了 很 多 Python 的 高 级 话题 ， 并 附 有 实例 ， 是 
本 即 学 即 用 的 书 。 本 书 首先 介绍 了 Python 的 数据 类 型 、 编 程 语法 、 函 数 、 类 和 模块 等 基础 知 
识 ， 然 后 介绍 了 Python 在 网 络 、 数 据 库 、 正 则 表达 式 和 大 数据 方面 的 应 用 。 每 一 章 的 最 后 都 
介绍 了 与 该 章 内 容 相 关 的 高 级 话题 ， 这 些 高 级 话题 可 直接 在 数据 处 理 、 网 站 开发 和 数据 库 管 
理 等 领域 使 用 ， 使 得 读者 每 学 习 一 章 即 可 通过 该 章 内 容 解决 工作 、 科 研 中 的 实际 问题 ， 充 分 
体现 了 即 学 即 用 特点 ， 突 破 了 以 往 必 须 将 书 读 完 才能 用 于 实战 的 思路 。 高 级 话题 涵盖 了 大 数 
据 分 析 用 的 NumPy、SciPy、PyTables 和 pandas 等 工具 ， 讲 解 了 如 何 采 集 数 据 以 及 如 何 为 调 
研 报告 生成 漂亮 的 图 表 等 内 容 。 书 中 的 案例 采用 实际 项 目 使 用 的 小 测试 案例 ， 具 有 极 强 的 实 
用 性 。 

下 面 是 各 章 内 容 简 要 介绍 ; 

第 1 章 是 Python 的 基础 介绍 ， 讲 解 了 Python 的 特点 ， 如 何 安装 和 使 用 Python， 介 绍 了 
Python 的 常用 绘图 工具 一 一 Matplotlib。 

第 2 一 4 章 分 别 讲解 了 Python 的 数据 类 型 程序 结构 和 函数 ,并 在 此 基础 上 介绍 了 NumPy 
和 SciPy 的 用 法 ,NumPy 是 开源 的 Python 科学 计算 库 ， 对 数组 和 和 矩阵 的 支持 使 其 成 为 Python 
科学 计算 软件 的 基础 。SciPy 基于 NumPy， 提 供 了 科学 计算 的 工具 集 软件 ， 涉 及 统计 、 优 
化 、 积 分 、 线 性 代数 模块 、 傅 里 叶 变 换 、 信 号 和 图 像 处 理 、 常 微分 方程 求解 器 等 。 书 中 介 
T NumPy 的 数据 类 型 、 通 用 函数 及 如 何 利用 SciPy 进行 科学 运算 。 

第 5 章 讲解 了 Python 的 类 文件 以 及 文件 系统 操作 ， 还 介绍 了 读 写 Excel 文件 的 三 个 
Python 库 : xlwt、xlrd、xlutils 。 

第 6 章 首 先 讲解 了 Python 的 模块 与 包 。 模块 与 包 是 Python 代码 的 组 织 基础 ， 恨 好 的 组 织 
结构 可 增强 代码 的 健壮 性 。 然 后 讲解 了 如 何 通 过 包 和 模块 发 布 Python 程序 。 

第 7 章 讲解 了 Python 中 面 癌 对 象 编程 的 知识 。 首 先 讲解 了 类 、 实 例 、 属 性 和 继承 多 态 等 
用 法 ， 通 过 Python 实现 模板 、 代 理 设 计 模 式 的 方式 介绍 了 类 的 使 用 ， 使 读者 能 够 更 加 清晰 地 
了 解 如 何 应 用 类 ， 如 何 设计 自己 的 程序 框架 ， 最 后 讲解 了 面向 对 象 的 高 级 话题 一 一 抽象 基 类 。 

第 8 章 和 第 9 章 采 用 相同 的 数据 模型 (todo K) 进行 讲解 。 第 8 章 首 先 介绍 了 Python 的 

IV 


— 


DB-API 2.0 接口 , 接着 


的 使 用 。 


的 开发 ， 为 使 


用 Web 框架 提供 了 基本 概念 ， 最 后 介绍 了 微型 的 Web 框架 Flask, Flask 一 节 使 


介绍 了 PostgreSQL 以 及 MySQL 数据 库 的 读 写 操作 , 最 后 
第 9 章 首先 从 socket JF 


` 


讲解 了 ORM 
展 到 CGI 程序 


"n. r 


了 如 何 构建 HTTP 访问 程序 ， 进 而 扩 


用 了 与 第 8 章 相同 的 todo 数据 库 。 


第 10 章 讲 解 了 正则 表达 式 ， 


iH 


na 


讲解 了 Tkinter, 


第 11 


了 


并 介绍 了 Beautiful Soup 包 。 
Tkinter 作为 Python 标准 自 带 的 GUI 设计 程 ) 


] 于 小 型 


> HJ 


二 


的 GUI 设计 。 然 后 讲解 了 专业 级 的 GUI 设计 程序 PyQt, PyQt 是 对 Qt 的 Python 包装 ， 不 仅 
包含 跨 平台 的 Qt GUI 设计 程序 ， 而 且 包含 了 视频 、 网 络 、 数 据 库 等 功能 模块 。 


第 12 章 是 关于 Python 在 数据 分 析 领 域 中 的 应 用 。 首 先 ; 
(JSON. XML). Hñ JSON 作为 一 种 基于 文本 
所 以 掌握 了 JSON 就 4 
仅 互 联网 领域 使 用 XML, 而 


REDIREN 


解 了 常用 的 数据 采集 方式 
的 数据 交换 格式 ， 广 泛 应 用 于 互联 网 领域 ， 
基 网 领域 的 数据 。XML 被 设计 用 来 传输 和 存储 数据 ， 不 


大 量 软件 


也 支持 XML, 例如 微软 的 Office 现在 已 经 使 用 Open 


Office XML (以 XML 和 ZIP 为 基础 构建 ) 代替 原 有 的 二 进 制 格式 文件 。12.2 节 讲 解 了 如 何 


使 用 Python 处 到 


式 的 数据 存储 ， 


用 于 存储 和 分 发 


Ë XML 数据 。12.3 rr 


Jf HDF5 接口 ， HDF5 是 一 种 不 同 于 数据 库存 储 方 
科学 数据 的 一 种 自我 描述 、 多 对 象 文 件 格式 。12.4 ENET 


pandas, pandas 已 经 成 为 Python 数据 分 析 的 标准 工具 ， 广 泛 用 于 时 间 序 列 数据 领域 。 
附录 讲解 了 如 何 安装 /编译 相应 的 Python 版 本 ， 以 及 如 何 通过 virtualenv 实现 多 个 独立 的 
Python 运行 环境 ， 并 给 出 了 Python 在 一 些 学 科 和 领域 的 优秀 软件 包 介 绍 ， 读 者 可 根据 需要 选用 


相应 的 软件 包 。 


本 书 使 用 Anaconda Python 作为 开发 环境 。Anaconda 是 Python 的 科学 技术 包 的 合集 ， 包 


含 了 大 量 的 科学 计算 包 ， 如 NumPy、SicPy 和 Matplotlib 等 ， 并 支持 Windows. Linux. OS X 
环境 。 相 比 其 他 Python 集成 开发 环境 ，Anaconda 4-1 cf Python 2.X， 而 且 支 持 Python 3.X 
的 科学 计算 包 。 可 从 Anaconda 的 官网 (https://www.continuum.io/downloads ) 下 载 相应 版 本 


的 Anaconda。 如 果 Anaconda 未 包含 书 中 所 用 的 模块 ， 可 参考 第 1 384r 


的 pip 和 easy. install 


的 方法 安装 相应 模块 。 本 书 以 Python 2 为 主 进行 讲解 ， 但 同时 提供 了 Python 2 和 了 Python 3 F 
的 代码 ， 便 于 读者 学 习 。 


本 书 的 第 6 


经 常 忽视 女儿 的 好 玩 天 性 ， 


关心 支持 我 的 人 


张 秀 凤 编写 


没 能 


| 


o 


; 第 10 章 由 丁 维 才 编写 , 其 余 内 容 由 本 人 编写 。 写 书 过 程 中 ， 
很 好 地 陪伴 女儿 ， 心 有 愧 次 。 谨 以 此 书 献 给 我 的 女儿 和 所 有 
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F 发 展 到 今天 ， 人 们 可 以 不 断 借助 于 各 种 已 有 软件 完成 科研 、 商 务 和 日 
Tf 发 模式 的 转变 ， 原 9 


AH 
的 发 展 和 软 
发 人 员 封 闭 姑 
最 


J" 


开发 技术 的 普及 也 促使 
FA. fH 


现在 人 人 都 可 以 根据 
始 的 阳春 白雪 转变 成 大 众 化 的 工作 。 


络 


723 


论 


已 


现在 专门 从 事 软件 开发 的 人 员 越 来 越 多 ， 多 数 情 况 下 数据 及 


室 、 工 业 现 1 
但 有 时 各 种 客观 条 件 限 制 


, 


Va 3 3 DU RH EL IET EE 251 
需要 数据 采集 者 能 够 对 这 些 


4 


AERE WIARE v l 3X 


E 接 到 项 
需要 编写 小 段 程序 进行 数据 处 理 


需 集 


， 软 件 


目 工 程 


后 ， 


诗 息 的 处 理 ， 如 处 理 


数据 、 信 |， 


自 


完成 初步 处 到 


E， 这 就 需要 非 软件 开发 人 员 上 自己 动手 编写 程序 。 


© 


É 据 am 


Spi, 


在 众多 程 


学 习 过 程 ， 


序 设 计 语言 ， 


，C/C++ 应 用 面 广 、 
使 得 很 多 学 习 者 迷失 在 前 进 日 


hi 


程序 效率 高 ， 但 不 容易 上 于 


的 道路 E. X 


ELEH C/C++ 完成 项 目 ] 


a | 


Ca 


JE. Java TE 


使 用 C/C4 


-+ 实现 自 


开发 难 


日 


RE 


需要 对 一 个 微分 方程 进行 求 值 时 ，Java 又 显 高 大 了 。 


学 研 
Visual Basic 以 及 C#5 
作 系 统 限 制 的 开发 语言 。 

在 这 种 情况 下 ， 越 来 越 多 
台 无 关 性 ， 还 具有 简单 易 用 、 
工具 唾 手 可 得 ， 在 4 


2T 
HJ 


11 Python 的 特点 


在 Python 的 环境 ， 
The Zen of Python。 在 此 可 看 到 
像 许 多 语言 那样 使 
Basicnet) 的 组 合 去 标 


然 方便 易 用 ， 但 


[ 究 中 具有 独到 之 处 ， 也 适合 科研 以 及 模型 处 理 


H 


, 


人 


Rr 


的 程序 员 和 科 和 
开发 效率 高 的 优 


Python 的 简洁 
1*0" (Plum C/C++、C#、Java) 或 者 “ 
注 语法 ， 它 使 用 了 缩 进 方式 ， 而 - 


HO 


但 


人 员 把 


点 


Uj 


A^ NI 


M 


为 缩 进 的 要 求 ， 使 得 代码 可 以 时 隔 多 
代码 的 功能 。 
虽然 Python 的 缩 进 功能 
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制 表 符 ) 即 为 缩 进 ， 空 白 的 长 度 用 于 看 


输入 “import this”， 可 看 到 Python Misi 
E. n E 


9 库 支持 。 


下 


其 


| ^ 到 


E tJ 


原 CES 


开发 、 


CH 


目光 投向 了 Python. Python 不 仅 具 有 3 
且 上 其 有 面向 对 象 编 
民 多 科学 领域 、 互 联网 领域 均 有 相应 上 


程 的 特点 ， 相 关 玫 


哲学 ， 即 Tim Peters 写 


E. HHH 


性 等 设计 思想 。Python 


常 工作 。 软 件 
中 软件 
发 从 


开 


从 实验 
人员 去 做 。 
-第 选 并 


艰辛 的 
开发， 更 谈 不 上 
虽然 有 所 降低 ， 但 相对 于 脚本 语言 ， 当 仅仅 
MATLAB 在 数据 处 理 、 
从 版 权 考虑 ， 它 又 过 了 
局 限 性 。 现 在 更 多 的 天 


科 


贵 。 微 软 的 
发 者 希望 选用 不 受 操 


区 
B 


k 


的 
不 


“Sub…End Sub” ( Visual 
日 这 个 缩 进 要 求 很 严格 。 但 也 正 


因 


， 仍 然 清 晰 明了 ， 而 不 用 去 猜测 自己 当初 写 的 这 上 段 


恨 强大 ， 但 实际 操作 是 很 简单 的 。 行 首 的 空白 (可 以 


角 定 逻辑 行 的 缩 进 层次 ， 从 而 


示 缩 进 等 级 的 空格 个 数 不 可 随意 改变 ， 


JF Hz 5j tb 


规范 ) 中 推荐 使 用 4 个 空 


2o 


格 的 缩 进 风 格 。 除 非 使 


用 


| 


表 符 不 可 混 


]. 4E PEP8 (Python ZW 


是 空格 和 
决定 语句 的 分 组 。 用 于 表 


fi 


则 只 要 是 支持 Python 语法 输入 的 编辑 器 均 有 快捷 输入 4 个 空格 不 需要 连续 输入 4 次 空 


格 ) 的 方法 。 


Python 即 学 即 用 


1.1. 为 何 适应 各 种 用 户 需 求 
1. 效率 高 


相对 于 C、C++ 和 Java. 等 编译 /静态 类 型 语言 ，Python 的 ] 


于 发 效率 提高 了 数 倍 。 要 完成 同样 


的 工作 ，Python 代码 的 长 度 往往 只 有 C++ 或 者 Java 代码 的 JS 一 13， 这 意味 着 可 以 录入 更 少 的 


代码 、 调 试 更 少 的 代码 并 在 开发 完成 后 维护 更 少 的 代码 。 并 有 


| Python 程序 可 以 编辑 后 立即 执 


行 ， 无 需 传 统 编译 /静态 语言 历 必需 的 编译 及 链接 等 步骤 ， 进 


2. 可 移植 性 好 


Python 很 重视 程序 的 可 移植 性 ， 可 以 设置 包括 程 


3. 原型 设计 转换 方便 


步 提高 了 程序 开发 效率 。 


F 严 处 理 等 操作 系统 接口 。 
绝 大 多 数 Python 程序 不 做 任何 改变 即 可 在 多 数 计算 机 平台 上 运行 。 例 如 在 Linux 和 Windows 
之 间 移 植 Python 代码 ， 只 需要 简单 地 在 计算 机 间 复 匀 


可 以 使 用 MATLAB 做 一 些 产品 设计 和 算法 设计 ， 但 从 实验 室 的 设计 过 渡 到 产品 设计 需 


不 一 样 了 ， 因 为 Python 的 基 
VTK 以 及 后 文 提 到 的 Sage, të 


1.1.2 胶水 特点 


Python 很 容易 连接 各 种 编译 


Python 称 为 CPython， 除 了 可 以 通过 C 语言 直接 调 
Boost 之 类 的 工具 可 以 对 Python 进行 扩展 ， 例 如 VTK 3j 


要 一 个 过 程 ， 这 个 过 程 多 数 情况 是 转换 成 C/C++ 代码 。 这 个 转换 过 程 往往 是 非常 艰辛 的 ， 有 
时 比 MATLAB 前 期 设计 还 费时 费力 (因为 MATLAB 已 包含 的 算法 ， 在 转换 成 C/C++ 时 可 能 
需要 从 头 做 起 )。 但 如 果 直 接 使 用 Python 做 原型 设计 ， 该 过 程 训 
础 库 大 部 分 是 基于 C/C++ 的 软件 。 这 些 软 件 例如 OpenCV, 
fit Y Python 接口 ，Python 可 以 方便 地 调用 它们 实现 各 种 3 
发 ， 不 仅 速度 快 ， 而 且 在 转换 成 CCC++ 产 品 时 ， 也 是 比较 方便 的 。 


此 使 用 Python 做 原型 开 


E， 这 是 它 作 为 胶水 语言 而 流行 多 年 的 重要 原因 。 标 准 的 
用 Python API 进行 扩展 ， 还 有 Swig、 
是 利用 Swig 实现 了 Python 接口 ， 


使 得 Python 用 户 可 直接 调用 VTK. mH. Python 语言 本 身 具 有 多 个 实现 版 本 ， 例 如 使 用 Java 


实现 的 了 Python。 这 种 实现 版 本 使 得 Python 具有 访问 Java 包 、 
特点 ， 使 得 Python 在 许多 开源 软件 中 具有 相同 的 Python 调用 
于 GPL 协议 的 开源 数学 软件 ， 将 现 


Sage 充分 体现 了 Python 的 胶水 特点 。Sage 
有 的 许多 开源 软件 包 整 合 在 一 起 ， 构 建 一 个 使 月 


113 语言 特点 


J H Python 作为 通用 接口 的 统一 计算 平台 ， 使 
用 高 度 优化 的 成 熟 软件 ， 如 GMP, PARI, GAP 和 NTL， 目 标 是 在 代数 、 几 何 、 数 论 、 微 
积分 、 数 值 计 算 等 领域 提供 可 用 于 探索 和 尝试 的 软件 。 


Python 相 比 C/C++ 之 类 语言 ， 缺 少 了 变量 声 
可 跟踪 对 象 的 类 型 ， 同 一 变量 名 也 可 直接 被 赋值 为 新 的 数据 


的 ， 例 如 : 


D» a-l 
>>> a=u" 新 的 数值 " 


>> 


RULES 


C# 库 的 能 力 。 也 正 是 因为 胶水 


明 、 变 量 定义 的 过 程 。Python 在 运行 过 程 中 


即 Python 是 动态 类 型 


$13 绪论 


"新 的 数值 " 


如 果 是 C 语言 ， 情 况 就 不 同 。 例 如 char a='1;a=0x32; 实 际 上 a 就 是 0 一 255 之 间 的 一 个 
数值 ， 同 时 对 应 ASCII fB 0—255 之 间 的 某 个 字符 。 即 使 通过 a=0x32 的 赋值 ， 也 没有 改变 a 

许多 语言 如 CH. Java 等 具有 自动 垃圾 回收 机 制 ，Python 也 是 如 此 ，Python 采用 引用 方 
式 自动 进行 对 象 分 配 ， 当 对 象 不 再 使 用 时 自动 执行 垃圾 回收 。 而 C++ 通过 new 创建 新 的 变量 
之 后 ， 必 须 有 对 应 的 delete， 和 否则 会 造成 内 存 泄 漏 。 

Python 中 万 物 皆 对 象 ， 如 数值 、 字 符 串 、 数 据 结 构 、 函 数 、 类 、 模 块 等 。 每 个 对 象 都 有 
一 个 与 之 相关 的 属性 和 方法 。 例 如 所 有 的 函数 都 有 一 个 内 置 的 _doc_ 属性， 它 会 返回 在 函 
数 源 代码 中 定义 的 文档 字符 串 。 又 如 sys 模块 是 一 个 对 象 ， 有 一 个 version 属性 ， 可 用 来 显示 
Python 版 本 信息 。 


>>> import sys 
>>> sys.version 
'3.4.3 (V3.4.3:9b73flc3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit (Intel)]' 


即使 是 C 语言 中 的 一 些 基本 数据 类 型 〈 字 符 型 、 整 型 、 浮 点 型 数据 )， 在 Python 中 也 都 
是 对 象 。 例 如 数值 1， 是 int 类 的 实例 ， 并 且 有 ”add 方法 。 


>>> type((1)) 
«class 'int'> 

>>> (1). class . 
«class "int 

2»»(1) add (2) 
3 


Python 的 数据 是 鸭子 类 型 (Duck Typing)， 是 指 对象 的 类 型 不 是 主要 的 ， 对 象 是 否 包 

相应 的 方法 或 者 属性 才 是 主要 的 。Python 中 的 文件 对 象 是 典型 的 鸭子 类 型 ， 即 只 要 含 

read0) 或 者 write() 的 方法 对 象 ， 均 可 当 作 文件 类 型 进行 数据 处 理 。 
相 比 C/Java 语言 ， 函 数 的 返回 值 可 以 是 多 个 。 例 如 ; 


>>> def f(): 

a=1 

b=2 

c=3 

return a,b,c 
>> fO 
(1,2,3) 
>>> a,b,c=f() 
>>> print (a,b,c) 
123 


1.1.4 语法 风格 
Python 不 需要 显 式 声明 变量 ， 变 量 在 第 一 次 被 赋值 时 自动 声明 。 这 是 与 CCt+、Java 语 
3 
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言 的 变量 定义 的 不 同 之 处 。 
Python 是 区 分 大 小 写 的 ， 标 识 符 的 第 一 个 
以 是 字母 和 数字 或 者 下 画 线 。 


Python 中 用 下 夯 线 作为 变量 前 级 和 后 级 指定 特殊 变 


^ 


字符 必须 是 字母 或 者 下 面 线 “_”， 其 余 字 符 可 


用 于 类 中 的 私有 变量 名 。 因 此 普通 变量 不 


Ete 


] F Hk 


Python 的 注释 分 为 两 种 。 


E, 


Ho 


xxx. 代表 系统 定义 名 字 ， 
VEIE E 


_XXX 


种 是 以 # 字 符 开 头 的 注释 ， 注 释 语句 从 # 字 符 开始 ， 直 到 该 行 


结束 。 注 释 可 以 在 一 行 的 任何 地 方 开 始 ， 解 释 器 会 包 略 该 行 # 之 后 的 所 有 内 容 。 例 如 : 


# 本 行 是 注释 
print “hello world" 


# 打 印 结束 


一 种 是 叫 作 文档 字符 串 Cdocstring). 的 特殊 注释 。 可 以 在 模块 、 类 或 者 函数 的 开头 ， 使 
用 单 引号 、 双 引号 、 三 引号 〈 用 于 多 行文 字 情 况 ) 添加 一 个 字符 串 ， 起 到 在 线 文 档 的 作用 ， 
函数 〈 方 法 )， 甚 至 包括 使 


常用 于 说 明 如 何 使 用 这 个 包 、 模 块 、 类 、 


j 示 例 和 单元 测试 。 后 


普通 注释 不 同 ， 文 档 字符 串 可 以 在 运行 时 访问 ， 也 可 以 用 来 自动 生成 文档 。 


文档 字符 串 出 现 的 位 置 包括 以 下 几 种 ; 
(1) 包 的 docstring 位 于 包 内 的 init.py H 


Tr 


的 


N 
o 


(2) 模块 的 docstring 位 于 模块 所 在 文件 的 开头 。 
(3) 函数 的 docstring 位 于 函数 名 称 所 在 行 的 下 一 行 ， 函 数 体 之 前 。 


(4) 类 的 docstring 位 于 类 的 名 称 所 在 行 的 下 一 行 ， 所 有 


例如 : 


#!/usr/bin/env python 

# -*- coding: utf-8 -*- 

# 模 块 的 docstring 

u" 这 是 模块 的 文档 字符 串 "" 


import os 

def test(): 

HERZ docstring 

u" 函 数 的 文档 字符 串 " 
print " test" 


if name ==" main " 


printtest. doc ££ test 函数 的 文档 字符 串 


Python ' 
个 没有 


可 通过 doc 特殊 变量 ， 获 得 文档 字符 串 ， 
赋值 的 字符 串 可 用 obj， doc 进行 访 问 。 其 中 obj 是 一 个 模块 、 类 或 者 函数 的 名 字 。 


述 之 前 。 


在 模块 、 类 声明 、 函 数 声 明 中 的 第 一 


Python 使 用 缩 进 来 分 割 代码 组 。 代 码 的 层次 关系 是 通过 不 同 深度 的 代码 体现 的 。 同 一 代 


码 组 的 代码 行 必 须 严格 左 对 齐 〈 左 边 有 同样 多 的 空格 或 者 同样 多 的 人 


上 表 符 )。 随 着 缩 进深 度 


的 增加 ， 代 码 块 的 层次 也 在 加 深 ， 没 有 缩 进 的 代码 是 最 高 层次 的 ， 称 作 脚 本 的 “主体 


(maim)” 部 分 。 缩 进 推荐 使 用 4 个 空格 形式 。 例 如 : 


def cmp(a ,b): 
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让 a>b:# 第 一 层 缩 进 
return 0# 第 二 层 缩 ; 
else : # 第 一 层 缩 进 
return 1# 第 二 层 缩 ; 


S] 


emp(1,2) # 最 高 层 


h 


115 多 平台 


在 很 多 操作 系统 里 ，Python 是 标准 的 系统 组 件 。 大 多 数 Linux 发 行 版 以 及 NetBSD. 
OpenBSD 和 Mac OS X 都 集成 了 Python， 可 以 在 终端 下 直接 运行 Python。 有 一 些 Linux 发 行 
版 的 安装 器 使 用 Python 语言 编号， 比如 Ubuntu 的 Ubiquity 安装 程序 、Red Hat Linux 和 
Fedora 的 Anaconda 安装 程序 。Gentoo Linux 使 用 Python 来 编写 它 的 Portage 包 管 理 系 统 。 
Python 标准 库 包 含 了 多 个 调用 操作 系统 功能 的 库 。 通 过 PyWin32 这 个 第 三 方 软件 包 ，Python 
能 够 访问 Windows 的 COM 服务 及 其 他 Windows API. {E IronPython, Python 程序 能 够 直 
接 调 用 .NET Framework。 一 般 说 来 ，Python 编写 的 系统 管理 脚本 在 可 读 性 、 性 能 、 源 代码 重 
用 度 、 扩 展 性 几 方 面 均 优 于 普通 的 shell 脚本 。 

Python 除了 在 UNIX/Linux, Windows 下 有 相应 实现 版 本 ， 在 AS/400 (OS/400). BeOS. 
MorphOS, MS-DOS, OS/2. OS/390. z/OS, RISC OS. Series 60, Solaris. VMS, Windows 
CE (Ek Pocket PC), HP-UX 系统 下 均 有 相应 实现 版 本 。 


1.16 ”丰富 的 支持 


Python 是 免费 、 开 放 的 ， 在 www.python.org 可 以 下 载 Python 源 代码 。 用 户 也 可 进行 源 
代码 的 修改 、 发 布 。 
当然 免费 不 代表 没有 技术 支持 。www.python.org 提供 了 Python 的 技术 支持 。 除 了 
Python 语言 本 身 的 支持 ， 还 有 大 量 有 关 Python 的 第 三 方 软件 。 在 1.2 节 将 给 出 有 关 Python 
的 版 本 与 集成 包 内 容 。 如 果 有 人 人 能够 将 Python 的 源 代码 进 行 包装 ， 并 加 上 一 些 吸引 用 户 的 
功能 ， 也 可 做 出 一 个 商业 化 的 Python， 还 不 用 担心 版 权 问 题 。 这 充分 体现 了 Python 的 开放 
性 。 

Python 的 标准 库 是 不 断 发 展 的 。 一 些 原本 优秀 的 第 三 方 库 ， 例 如 ctypes,PyUnit (现在 改 
名 为 unittest〉 随 着 Python 的 发 展 ， 逐 渐 成 为 标准 库 。 正 因为 Python 的 开放 性 才 使 得 Python 
的 第 三 方 库 非 常 多 ， 进 而 促使 Python 越 来 越 强 大 ， 应 用 面 越 来 越 广 。 


12 Python 版 本 与 集成 包 


我 们 经 常 讨论 的 Python 是 指 CPython. (BHMA www.python.org 上 下 载 的 Python 版 本 )， 除 
了 CPython， 还 有 一 些 其 他 的 实现 版 本 。 
€ IronPython 是 一 种 在 NET 和 Mono 上 实现 的 Python 语言 。 
€ Jython 的 原名 叫 JPython, 是 Python 编程 语言 的 纯 Java 实现 。 它 可 以 让 用 户 将 
Python 源 代码 编译 成 Java 字 节 码 ， 并 在 任何 Java 虚拟 机 上 运行 产生 的 字 节 码 。 它 
是 与 Java 的 最 无 缝 、 最 平滑 的 集成 。 可 以 从 Jython 中 访问 所 有 Java 库 、 构 建 
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Applet、 与 Java Bean 集成 以 及 从 Jython 的 Java 类 中 创建 子 类 。 
€ Stackless Python 修改 了 Python 的 代码 ， 提 供 了 对 微 线 程 的 支持 。 微 线程 是 轻 量 级 的 线 
程 ， 与 普通 的 线程 相 比 ， 微 线程 在 多 个 线程 间 切 换 所 需 的 时 间 更 少 ， 占 用 资源 也 更 少 。 
€ IPython 具有 强大 的 交互 式 的 Python shell. (基于 终端 和 Qt AR); 基于 Web 的 交互 式 
笔记 环境 ， 拥 有 所 有 shell 功能 ;一 个 高 性 能 库 ， 可 用 于 多 核心 系统 、 集 群 、 超 级 计 
算 和 云 场景 中 的 高 级 、 交 互 式 并 行 计 算 。IPython 的 特点 是 交互 式 翻 译 器 ， 人 允许 以 最 
快 的 速度 测试 用 户 的 想法 ， 而 不 必 创建 一 个 文件 。 
另外 还 有 将 CPython 以 及 其 他 Python 软件 做 了 重新 包装 的 软件 ， 例 如 : 
@ ActivePython 是 由 ActiveState 公司 推出 的 专用 的 Python 编程 和 调试 工具 。 
ActivePython 目前 支持 Windows x86、Windows x64, Linux x86、Linux x86-64、Mac 
OS X。 分 为 社区 版 与 商业 版 。 
@ pythonxy 是 基于 Qt 和 Spyder 的 面向 科学 的 Python 发 布 包 。 可 从 http:/code.google. 
comyp/pythonxy/ 获 得 ， 但 目前 仅 文 持 Windows 操作 系统 。 
© WinPython 的 主要 特点 是 可 安装 在 U 盘 或 任意 文件 夹 下， 随意 复制 ， 且 不 影响 功能 。 
安装 时 会 自动 安装 Spyder。 
€ Enthought Canopy 是 一 款 商业 Python 软件 ，GUI 基于 wxPython， 提 供 免 费 版 和 学 术 
版 ， 包 含 IPython。 
€ Anaconda Python 可 从 https:/store.continuum.io/cshop/anaconda/ 获 得 ， 完 全 免费 ， 是 
一 个 全 面 的 Python 发 布 包 ， 包 含 120 多 个 流行 的 Python 包 ， 这 些 包 可 用 于 科学 、 数 
学 、 工 程 和 数据 分 析 。 支 持 Linux. Windows. Mac 操作 系统 。 默 认 提 供 了 Spyder, 
包含 IPython. 
Python 的 版 本 比较 多 ， 可 更 好 地 配合 各 种 开发 语言 。Python 的 集成 包 也 比较 多 ， 选 用 合 
适 的 集成 包 可 减少 后 续 Python 软件 模块 的 安装 。 


13 Python 的 下 载 与 安装 


1.3.1 下 载 Python 


Python 分 为 Python 2 与 Python 3 两 个 系列 ， 本 节 以 Python 2 为 例 说 明 安 装 过 程 。 可 从 
www.python.org 获取 各 操作 系统 下 的 Python 安装 包 。Python 网 站 上 提供 了 多 种 类 型 的 安装 
包 ， 从 源 代码 到 各 操作 系统 的 执行 软件 。 

本 书 中 只 是 下 载 Windows 下 的 Python 2.7 软件 。 下 载 地 址 为 http:/www.python.org/ftp/ 
python/2.7.6/python-2.7.6.msi《〈 作 者 也 提供 了 针对 Python 3 的 代码 ， 可 在 http:/www.cmpbook.com 
下 载 )。 


L3.2 Python 在 Windows 下 的 安装 


于 基于 UNIX/Linux 的 系统 往往 已 经 安装 了 Python， 所 以 本 书 以 Windows Z&Zt Plu 
解 如 何 安装 Python. 
下 载 安装 包 后 ， 与 安装 其 他 Windows 软件 一 样 ， 直 接 用 鼠标 双击 安装 包 ， 而 后 单 击 


ES 
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“next” 按 钮 即 可 完成 安装 。 安 装 路 径 为 默认 路 径 ， 即 cNpython27, WK 1-1 所 示 。 


安装 完毕 ， 可 以 看 到 IDLE 与 Python(command line)， 如 图 1-2 所 示 。 运 行 Python 


(commond line)， 即 可 进入 运行 环境 ， 如 图 1-3 所 示 。 


i Python 2.1.6 Setup 


e 


Select Destination Directory 


Please select a directory for the Python 2.7.6 files. 


| E Python27 pora 


k Python 2.7 
** IDLE (Python GUI) 
a 
[CAPython27 >, Module Docs 
€. Python (command line) 


et 
$9! Uninstall Python 


python 
windows 


= 


图 1-2 Python 安装 目录 


图 1-1 Python 安装 路 径 选 择 


为 了 能 在 Windows 命令 行 中 运行 Python， 需 要 配置 Python 的 路 径 。 方 法 如 下 : duh 
【我 的 电脑 】 一 【属性 】 一 【高 级 】 一 【环境 变量 】])， 在 【系统 变量 】 中 找到 Path, @ £ 
PYTHON.exe 文件 在 哪个 文件 夹 下 面 〈 默 认 安 装 时 为 C:\python27)， 然 后 把 路 径 加 到 Path 的 
后 面 〈 与 原 有 内 容 用 英文 分 号 隔 开 )， 这 样 可 以 在 已 有 的 Python 文件 (以 py 为 扩展 名 的 文 


件 ) 上 双击 执行 相应 的 程序 。 


@ Python (command line) BEI 
Python 2.7.6 <default, Nou 10 2013. 19:24:18) [MSC o.1500 32 bit <Inte1)1 on wing 
32 

Type "help". "copyright". "credits" or "license" for more information. 


>>> 


图 1-3 Python 的 命令 行 
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13.3 Anaconda 


Anaconda 是 Pyhton 的 集成 开发 包 ， 包 含 了 Spyder、IDLE 等 开发 环境 ， 并 包含 了 大 


EA 
FH 


的 Python 软件 包 ， 可 用 于 科学 、 数 学 、 工 程 、 数 据 分 析 等 领域 。http:/docs.continuum io/ 


anaconda/pkg-docs 给 出 了 Anaconda 的 各 种 安装 包 。 


目前 Anaconda 提供 Python 2.6.X, Python 2.7.X, Python 3.3.X 和 Python 3.4.X 四 个 系列 
RIT, LFF Windows. OS X. Linux 环境 〈 多 操作 系统 并 且 文 持 Python 2/3， 是 Anaconda 
相 比 其 他 几 款 Python 集成 环境 的 最 大 优点 )， 读 者 可 根据 所 用 操作 系统 以 及 Python 版 本 下 载 


相应 的 Anaconda 版 本 。 下 载 地 址 为 http://continuum.io/downloads。 


Anaconda 在 Windows 下 的 安装 属于 一 键 方式 ， 与 日 常 所 见 的 各 种 软件 的 setup.exe 安装 


方式 相同 ， AAT HA rH next 按钮 即 可 。 


在 Linux 下 ， 首 先 下 载 Anaconda 的 Linux 版 本 。 下 面 以 下 载 的 Anaconda3-2.3.0-Linux- 


x86.sh 为 例 说 明 安 装 的 过 程 与 注意 事项 。 
python(gdebian: —/ $ '/home/python/ Anaconda3-2.3.0-Linux-x86.sh' 


在 出 现 授权 信息 之 前 ， 提 示 需 要 按 回 车 键 ， 查 看 版 权 信息 。 


In order to continue the installation process, please review the license agreement. 
Please, press ENTER to continue 


版 权 信 息 比 较 长 ， 在 查看 过 程 中 ， 别 错过 下 面 语句 ， 否 则 需要 从 头 开 始 。 


Do you approve the license terms? [yeslno] 
[no] >>> yes 


指定 安装 位 置 ， 并 回 车 确认 : 


Anaconda3 will now be installed into this location: 


/home/python/anaconda3 


- Press ENTER to confirm the location 
- Press CTRL-C to abort the installation 
- Or specify a different location below 


下 面 的 信息 提示 是 否 将 Anaconda 添加 到 路 径 中 ， 确 认 后 安装 完毕 。 


` 


Do you wish the installer to prepend the Anaconda3 install location 
to PATH in your /home/python/.bashrc ? [yes|no] 
[no] >>> yes 


需要 注意 的 是 ， 系 统 默认 的 仍然 是 Linux 系统 自 带 的 Python 版 本 ， 为 了 运行 anaconda 


的 Python 版 本 ， 需 要 执行 anaconda3/bin 目录 下 的 Python， 方 法 如 下 : 


python(gdebian: —/anaconda3/bin$ ./python 

Python 3.4.3 |Anaconda 2.3.0 (32-bit)| (default, Jun 4 2015, 15:28:02) 
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> exit() 
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1.4 Python 85 IDE 


Python 的 集成 开发 环境 ADE) 非常 丰富 ， 常 见 的 有 IDLE、PyCharm 和 Spyder 等 。 


1.4.1 IDLE 


IDLE 是 Python 软件 包 自 带 的 一 个 集成 开发 环境 ， 在 图 1-2 中 ， 单 击 IDLE (Python 
GUI)， 将 打开 Python 的 集成 开发 环境 ， 如 图 1-4 所 
示 ， 在 >>> 后 面 输入 print(1,2,3,4)， 将 输出 (1,2,3,4) 的 元 
组 数据 ， 如 图 1-4 所 示 。 在 图 1-4 所 示 的 开发 环境 中 ， 
选择 File 一 New File (或 者 按 快捷 键 (CtrItN) ) 将 建立 


表 1-1 IDLE 常用 快捷 键 


命令 作 


一 


E ; : Ctr N 打开 一 个 新 的 编辑 器 窗口 
一 个 新 的 Python 源 文 件 。IDLE 常用 快捷 键 见 表 1-1。 ctrLHo 打开 已 有 文件 进行 编辑 
列 如 输出 “Welcome to Python World”, nm 保存 当前 程序 
1) 选择 File 一 New File 新 建文 件 ， 并 在 新 建立 文件 F5 运行 当前 程序 


中 输入 
print “Welcome to Python World” 


2) 选择 菜单 File 一 Save 将 程序 存盘 。 将 其 存储 在 Python 程序 文件 夹 中 ， 并 命名 为 
welcome.py， 末 尾 的 .py 表明 这 是 一 个 Python 文件 。 

3) 选择 菜单 Run— Run Module 运行 程序 。 将 出 现 一 个 Python shell， 其 中 显示 了 
“Welcome to Python World". 


Python 2. 7. 6 Shell 


File Edit Shell Debug Options Windows Help 


Python 2.7.6 (default, Nov 10 2013, 19:24:18) [MSC v.1500 32 bit ( - 
Intel)] 3 


Tvpe "copyright", "credits" or "license()" for more 
3,4 


information. 


图 1-4 IDLE 运行 


1.4.2 PyCharm 


PyCharm 是 由 JetBrains 打造 的 一 款 Python IDE， 具 有 调试 、 语 法 高 亮 、 项 目 管理 、 代 
人 码 跳 转 、 智 能 提示 、 自 动 完成 、 单 元 测试 、 版 本 控制 等 功能 。 目 前 PyCharm 拥有 商业 版 与 
社区 版 两 个 版 本 。 可 从 https://www.jetbrains.com/pycharm/ F 3%, 

https:;//www.jetbrains.com/pycharm/features/editions comparison matrix.html 给 出 了 社区 版 


9 


Python Fp 5 PP Jf] 


与 商业 版 的 区 别 ， 社 区 版 已 经 满足 多 数 场合 下 的 Python 开发 ， 推 荐 使 用 社区 版 。 


在 使 用 PyCharm 时 需要 首先 配置 Python 解释 器 的 位 置 ， 见 图 1-5, 


司 时 PyCharm 支持 


创建 虚拟 环境 ， 单 击 图 1-5 中 的 Project Interpreter 后 面 的 小 齿轮 图 形 ， 即 出 现 创 建 虚拟 环境 


的 对 话 框 ， 如 图 1-6 所 示 。PyCharm 的 安装 需要 Java 的 JDK. 


KK Settings 
(Q 了 
© Appesrance & Beh: P, 
Appearance 
Menus and Toolbars == kasqa + 
G) System Settings 
File Colors yaja apee E 
1.0.0 1.0.0 t 
0.22.1 + 0.23 
0.10.1 0.10.1 
2.13 »28 
0.23 0.23 
2.8.2 m 2.9.0 
3a 3 
2.0.2 2.0.2 
1.0.5 = 1.0.8 
0.10.4 0.10.4 
Project Structure 0.1.3 0.1.3 
Œ Build, Execution, Deployment 0.7.3 = 0.7.6 
© Languages & Frameworks 0.8.9 => 0.9.0 
E Tools 1.0.3 1.0.3 
3.4.0.2 
0.9.0 => 0.10.0 
4.3.2 "iio 
0.11.0 0.11.0 
0.8.1 0.8.1 
0.8.0 = 082 
0.6.2 0.6.2 
0.9.0 = 0.9.2 
LI 2.38.0 2.38.0 
decimal 3 23 
fi 145.14 m 2015.04. 28 
c£fi 110 = 1.1.2 
Cancels) | ie m | 
图 1-5 在 PyCharm 中 配置 Python 解释 器 
Add Local 
Create VirtualEnv 
More... 


图 1-6 PyCharm 创建 虚拟 环境 


PyCharm 可 安装 Python 包 ， 如 果 源 程序 目录 中 包含 pip 所 对 应 的 requirements.txt 文件 ， 


将 提示 自动 安装 /更 新 requirements.txt 中 的 Python 包 。 


1.4.3 Spyder 


Spyder 是 一 款 强 大 的 Python 交互 开发 环境 ， 具 有 高 级 编辑 、 交 互 测试 、 调 试 和 检查 功 
能 。 该 软件 专注 于 科学 计算 ， 提 供 了 与 MATLAB 相似 的 环境 。Spyder 已 经 包含 在 Python(x,y)， 
WinPython, Anaconda 中 ， 如 果 安 装 了 这 些 软件 ， 则 无 需 再 安装 Spyder. Spyder 支持 
Windows. Mac OS X. Linux 平台 。 用 户 可 从 http://code.google.com/p/spyderlib/ 获 得 Spyder 


的 安装 文件 。 
Spyder 具有 如 下 特点 : 
e 支持 控制 台 方 式 。 


e 可 直接 编辑 变量 值 ， 并 可 将 变量 值 导出 成 多 种 文件 类 型 (文本 文件 、NumPy 文件 、 


MATLAB 文件 )。 可 绘制 列表 和 数值 的 二 维 图 。 
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@ 支持 Pylint (Python 代码 分 析 工 具 )， 可 分 析 Python 代码 中 的 错误 ， 查 找 不 符合 代码 
风格 标准 和 有 潜在 问题 的 代码 。 

e 文 持 在 线 文档 。 

Spyder 的 界面 如 图 1-7 所 示 。 


4 Spyder (Python 27) < was EN E — w k m = 7 L= 9 asw 
File Edit Search Source Run Debug Interpreters Tools View ? " 
iL] L ld ia| Pe 4-2 L4 Waregem (ROX Bj e Ə ciavice Sri +à 44 


ject inspector mx 
S = jiwa -0 = 


No documentation available 


Object inspector Varisble explorer | File explorer 


Python 2.7.6 |Anaconda 1.9.1 EUR bit bio (etos ult, Nov 11 2013, 10:56: EU [MSC v.1500 32 bit (Intel)] on win32 
Type "help", "Copyright" * for informatio! 


Imported NumPy 1.8.0, SciPy 0.13.3, Matplotlib 1.3.1 
Type "scien tific" for more details. 


>>> runfile('t:/15/2014/python/ch1/: (KB /spyder .py'，wdir=r'E:/ 书 /2914/python/ch1/ 源 代码 ') 
ello 


Console History log IPython console 
Permissions: RW End-of-lines: CRLF Encoding: UTF-8 Line: 8 Column: 6 — Memory: 78 X 


图 1-7 Spyder MAH 


1.4.4 其 他 IDE 


除了 前 面 介绍 的 几 个 Python 集成 开发 环境 ， 还 有 很 多 可 用 于 Python 开发 的 集成 开发 环 
境 或 编辑 器 ， 简 单列 举 如 下 : 
€ PyDev 是 一 个 Eclipse 中 的 Python 开发 环境 ， 需 要 Java， 跨 平台 ， 需 要 手工 配置 


Python 解释 器 路 径 。 
e 对 于 习惯 Visual Studio 开发 环境 的 用 户 ， 也 可 借助 PVTS 控件 ， 使 用 Visual Studio 进 
行 开 发 。 


€ WingIDE 是 个 Python 集成 开发 环境 (商业 软件 )。 
€ Eric 是 跨 平 台 、 全 功能 的 Python 和 Ruby 编辑 器 。 


15 ”软件 包 的 安装 方法 


正常 情况 下 ， 要 给 Python 安装 第 三 方 的 扩展 包 ， 首 先 必须 下 载 压缩 包 ， 解 压缩 到 一 个 
目录 ， 在 命令 行 或 终端 打开 这 个 目录 ， 然 后 执行 : 


python setup.py install 


来 进行 安装 。 但 该 方式 容易 出 现 依赖 包 未 安装 的 情况 。 实 际 上 ，easy_install 和 pip 是 更 常用 
的 软件 包 安 装 工 具 。 
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easy install 的 作用 和 Perl 中 的 cpan，Ruby 中 的 gem 类 似 ， 都 提供 了 在 线 一 键 安装 模块 
的 快捷 方式 ， 而 pip 是 easy. install 的 改进 版 ， 不 仅 能 提供 更 多 信息 ， 还 可 以 删除 扩展 包 。 


1.5.1 easy. install 


1. easy install 的 安装 


easy install 位 于 https://pypi.python.org/pypi/setuptools。 可 以 通过 python setup.py install 
方式 安装 ， 或 使 用 ez setup.py 方式 安装 。 

2. easy install 的 用 法 

1) 安装 一 个 包 


easy install <package_name> 


easy install "<package_name>==<version>" 
例如 : 

easy install sqlobject 
2) 升级 一 个 包 

easy install -U "<package_name>>=<version>" 


例如 : 


easy install -U flask 


1.5.2 pip 
使 用 pip 的 install 命令 即 可 安装 一 个 指定 的 软件 包 : 


$ pip install SomePackage 


如 果 要 升级 某 个 软件 包 ， 需 要 指定 --upgrade 参数 : 


$ pip install --upgrade SomePackage 


如 果 要 安装 指定 版 本 的 软件 包 ， 直 接 指定 软件 包 版 本 即 可 : 


$ pip install SomePackage--1.0.4 


pip 还 可 指定 安装 包 的 路 径 ， 包 括 从 本 地 源 代码 安装 或 者 从 网 上 的 某 个 链接 安装 : 


$ pip install /downloads/SomePackage-1.0.4.tar.gz 
$ pip install http://my.package.repo/SomePackage-1.0.4.zip 


SEI AEG, TER] uninstall 命令 即 可 : 
$ pip uninstall package-name 
如 果 不 清楚 要 安装 的 软件 包 的 具体 名 称 ， 可 以 使 用 search 命令 进行 查询 : 


$ pip search "query" 
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它 会 列 出 所 有 相关 的 软件 包 。 

pip install -r requirements.txt 与 pip freeze > requirements.txt 是 一 对 导出 所 有 Python 包 列 
表 ， 并 安装 Python 包 的 命令 。 

为 了 保证 后 续 章 节 提 及 的 软件 包 都 正常 安装 ， 需 要 执行 pip install -r requirements.txt。 
其 中 requirements.txt 在 本 节 源 代码 目录 中 。 
使 用 easy_install 或 者 pip 安装 有 时 会 弹出 如 下 错误 : 

UnicodeDecodeError: 'ascii' codec can't decode byte 0xb0 in position 1: ordinal not in range(128) 

解决 方法 : 打开 Ci\Python27\Lib 下 的 mimetypes.py 文件 ， 找 到 大 概 256 行 的 “default - 
encoding=sys.getdefaultencoding()” 在 这 行 前 面 添 加 如 下 四 行 代码 ， 即 可 修正 UnicodeDecodeError 
异常 : 


if sys.getdefaultencoding() != 'gbk': 
reload(sys) 

sys.setdefaultencoding('gbk") 

default encoding = sys.getdefaultencoding() 


1.6 高 级 话题 : Matplotlib 


本 节 主 要 介绍 Python 中 的 绘图 工具 Matplotlib。Matplotlib 是 Python 中 最 著名 的 绘图 
库 ， 它 提供 了 一 整套 和 MATLAB 相似 的 命令 API， 十 分 适合 交互 式 地 进行 制图 ， 也 可 以 方 
便 地 将 它 作 为 绘图 控件 ， 嵌 入 GUI 应 用 程序 (在 第 11 章 中 可 以 看 到 Matplotlib IKE] PyQt 
) 或 CGI、Flask、Django 中 。 


1.6.1 Matplotlib 特点 


Matplotlib 具有 如 下 特性 。 

@ Matplotlib 支持 交互 式 和 非 交 互 式 绘图 。 

e 可 将 图 像 保 存 成 PNG 、PS 等 多 种 图 像 格 式 。 

e 文 持 曲线 (折线 ) 图 、 条 形 图 、 柱 状 图 、 饼 图 。 

e 图 形 可 配置 。 

e 跨 平 台 ， 支 持 Linux, Windows, Mac OS X 与 Solaris。 

€ Matplotlib 的 绘图 函数 基本 上 都 与 MATLAB 的 绘图 函数 名 字 差 不 多 ， 迁 移 学 习 的 成 
本 比较 低 。 

e 支持 LaTeX 的 公式 插入 。 


1.6.[2 Matplotlib 绘图 
下 面 的 程序 给 出 了 Matplotlib 绘图 的 简单 


— 


网 子 。 运 行 后 将 显示 图 1-8。 


import matplotlib.pyplot as plt# 与 MATLAB 区 别 ， 在 Python 环境 下 使 用 ， 必 须 引 入 Matplotlib 包 
plt.plot([1, 2,3,8,5])# 除 了 “plt.” 部 分 ， 其 余部 分 与 MATLAB 中 的 plot 是 一 样 的 
plt.show() 
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0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 
图 1-8 Matplotlib 的 单条 曲线 绘图 
图 1-8 作为 科研 、 演 示 用 图 是 不 完整 的 。 一 张 图 往往 是 多 条 曲线 ， 相 互 对 比 。 另 外 还 需 
标 轴 、 图 标题 、 图 例 的 说 明 ; 还 需要 用 不 同 颜色 标注 曲线 以 及 网 格 显示 图 。 
下 面 给 出 一 个 综合 例子 ， 绘 制 多 条 曲线 ， 增 加 坐标 轴 、 图 标题 和 图 例 。 代 码 为 chl-1.py。 


[之 


xE 


] #!/usr/bin/env python 

2 #-*- coding: utf-8 -*- 

3 import matplotlib.pyplot as plt # 与 MATLAB 区 别 ， 在 Python 环境 下 使 用 ， 必 须 引 入 
Matplotlib 包 

4 import matplotlib as mpl 


5  myfont- mpl.font manager.FontProperties(fname-' C:/Windows/Fonts/msyh.ttf") 

6  dmplrcParams['font.sans-serif] =['SimHei']# [SimHei]# ['SimHei'] # 指 定 默 认 字 体 
7 pltplot([-2.2,3,4,5],r,label=u 第 一 条 曲线 )# 颜 色 为 红色 的 曲线 
8 
9 


plt.plot([3,4,5,8,9],b,label=u 第 二 条 曲线 )# 颜 色 为 蓝 色 

plt.legend () 
10 ”#plt.legend((u' 第 一 条 曲线 'u' 第 二 条 曲线 ') )#n] mi lengend 函数 指定 legend 
11 plt.grid(True) 
12  plt.axis([0 ,5,-3,9]) # 坐 标 轴 的 最 大 值 与 最 小 值 
13  plt.xlabel(u'X 轴 坐 标 ',fontproperties=myfont)# 坐 标 轴 标签 
14  plt.ylabel(u'Y 轴 坐 标 ',fontproperties=myfont) 


15 ”plt.title(u' matplotlib 演示 图 ',fontproperties=myfont) 
16 plt.show() 
17 ”plt.savefig('plot123.png') # 保 存 图 形 


1 一 2 行 : 指明 在 UNIX/Linux 中 的 Python 解释 器 位 置 ， 文 件 编码 类 型 设 为 UTF-8， 本 
程序 包含 中 文 ， 故 此 需要 第 2 行 代码 。 

3—41]: SX matplotlib 模块 。 

5—6 行 : 设置 字体 的 两 种 方式 ， 本 程序 使 用 了 第 5 行 的 方式 。 在 13、14、15 行 中 使 用 
fontproperties 方式 指定 字体 。 

7-10 行 : 绘制 两 条 曲线 。 通 过 legend 函数 指定 图 例 。plot 函数 也 文 持 同时 绘 表 
线 的 方式 。 如 果 没 有 在 plot 函数 中 指定 label， 可 通过 第 10 行 的 方法 另外 指定 图 例 。 


多 条 


c— 
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11 fT: 显示 网 格 。 
12—15 fT: 用 于 显示 坐标 轴 与 图 的 标题 。 
16—17 ÍF: 显示 图 形 ， 并 将 其 保存 为 文件 形式 。 绘 制 的 图 形 见 图 


matplotlib 演示 图 


= 


-9。 


2 3 
X 轴 华 标 


图 1-9 Matplotlib 绘制 两 条 曲线 


在 http://matplotlib.org/gallery.html 给 出 了 matplotlib 可 绘制 的 图 形 形 式 。 如 果 通 过 一 张 漂 
亮 图 能 打动 客户 或 上 级 ， 从 中 仔细 选用 一 种 合适 的 图 形 是 值得 的 。 


1.63 用 Matplotlib 绘制 股票 历史 K 线 图 


股票 是 一 个 使 人 着 迷 甚 至 疯狂 的 财富 载体 。Matplottib 可 以 直接 读 取 Yahoo 网 站 提供 的 
股票 历史 行情 数据 。 
下 面 的 程序 可 通过 Yahoo 读 取 中 石油 股票 的 历史 数据 ， 并 绘制 K 线 图 。 代 码 为 ch1-2.py: 


]  fs/usr/bin/env python 

2 -*- coding: utf-8 -*- 

3 import matplotlib.pyplot as plt 

4 from matplotlib.dates import DateFormatter, WeekdayLocator,DayLocator MONDAY 
5 from matplotlib.finance import quotes historical yahoo, candlestick 

6 from matplotlib.font manager import FontProperties 

7 | import datetime 

8  font- FontProperties(fname-r"C:/Windows/Fonts/msyh.ttf"size-18) 

9 # 定义 起 始 、 终 止 日 期 和 股票 代码 

10 datel= (2007,11,25) 

11 date2 = (2008,12,20)#datetime.datetime.now () 

12 stock num ='601857.ss'# 上海 的 为 ss， 深圳 的 为 sz 

13. # 定义 日 期 格式 

14 mondays = WeekdayLocator(MONDAY) 

15  alldays = DayLocator() 

16 weekFormatter= DateFormatter('%b %d') 

17 dayFormatter = DateFormatter('%d') 

18 # 获取 股票 数据 
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19 quotes = quotes historical yahoo(stock num, datel, date2) 
20  iflen(quotes) — 0: 

2] raise SystemExit 

22 fig, ax = plt.subplots() 

23 fig.subplots_adjust(bottom=0.2) 

24  ax.xaxis.set major locator(mondays) 

25  ax.xaxis.set minor locator(alldays) 

26  ax.xaxis.set major formatter(weekFormatter) 

27 . candlestick(ax, quotes, width=0.0) 

28  ax.xaxis date() 

29  ax.utoscale view() 

30  plt.setp( plt.gca().get xticklabels(), rotation-45, horizontalalignment-'right") 
31 “plt.title(u' 中 石油 2007 -2008'fontproperties-font) 

32  pltshow() 


3—7 ff: 导入 matplotlib 库 ， 其 中 matplotlib.pyplot 一 行 导入 matplotlib.pyplot， 并 命名 


为 plt。matplotlib.finance 一 行 是 导入 读 取 Yahoo 数据 的 函数 。matplotlib.font manager 一 行 


导入 Matplotlib 显示 汉字 的 字体 管理 函数 。 
8 行 : 为 显示 中 文 ， 重 新 设置 了 字体 。 


Tur 


13—17 fp: 创建 一 个 日 期 格式 化 器 以 格式 化 X 轴 上 的 日 期 。weekFormatter 


DateFormatter ('%b 96d") 创建 了 包含 星期 与 日 期 的 格式 。 


是 


19—21 行 : 通过 Yahoo 获取 股票 历史 数据 ，quotes_historical yahoo 函数 在 输入 股票 代 


人 码 时 ， 上 证 需要 加 后 级 ”.ss”; 深 证 需要 加 .sz”。 可 通过 返回 的 quotes 观察 读 取 的 数据 情况 。 


24—26 fJ: 设置 定位 器 和 格式 化 器 。 
27 一 32: 绘制 蜡烛 线 ， 并 通过 pltsetp 设置 线 的 属性 。 


图 1-10 为 通过 Yahoo 读 取 的 股票 历史 行情 。 估 计 很 多 人 看 到 这 个 股票 的 当年 数据 ， 多 


么 希望 将 显示 器 上 下 站 倒 过 来 。 


中 石油 2007 -2008 
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= 
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图 1-10 Matplotlib 读 取 yahoo 网 数据 绘制 K 线 图 
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1.7 小 结 


本 章 主 要 说 明 为 何 选择 Python, MAT Python 的 语言 特点 。 给 出 了 Pyhton 开发 环境 的 
准备 : 标准 版 Python 的 安装 、Anaconda 的 安装 、Python 的 IDLE 开发 环境 、Anaconda 包含 
的 Spyder 开发 环境 、Python 的 重量 级 IDE 一 一 PyCharm， 以 及 如 何 通 过 easy_install、pip 安 
装 Python 软件 包 。 在 1.4 节 中 介绍 的 三 种 IDE 各 有 特点 ，IDLE 是 Python 自 带 的 ，Spyder 
是 Anaconda 与 Python(x,y) 集 成 环境 自 带 的 ， 比 IDLE 功能 丰富 。PyCharm 功能 最 为 完善 ， 
但 需要 Java 支持 ， 而 且 每 次 启动 PyCharm 时 间 较 长 。 如 果 编 写 小 程序 ， 可 使 用 DLE 或 者 
Spyder， 如 果 做 大 型 工程 还 是 推荐 PyCharm. 

在 高 级 话题 中 介绍 了 Matplotlib 。Matplotlib 能 够 绘制 出 优秀 的 图 表 ， 在 后 续 的 章节 中 可 
以 看 到 Matplotlib 也 可 用 于 Web 编程 以 及 GUI 环境 中 。 
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第 2 章 数据 类 型 


Python 具有 丰富 的 数据 类 型 ， 包 括 字符 串 、 列 表 、 元 组 、 字 典 等 ， 掌 握 这 些 数 据 类 型 的 
特点 ， 并 灵活 运用 它们 ， 将 使 Python 编程 变 得 灵活 自如 。 


21 数字 数据 类 型 


Python 支持 多 种 数字 数据 类 型 ， 包 括 整 型 、 长 整 型 、 布 尔 型 、 双 精度 浮 点 型 和 复数 。 
Python 中 所 有 的 数字 都 是 对 象 ， 是 不 可 更 改 类 型 ， 也 就 是 说 数字 的 值 改 变 了 就 会 产生 新 的 
对 象 。 

Python 中 变量 不 需要 事先 声明 ， 只 要 在 使 用 时 直接 赋值 即 可 (与 MATLAB 的 变量 定义 
方式 相同 )。 赋 值 后 ， 变 量 中 存放 的 是 对 象 的 引用 。 

例如 : 


ra=35 


首先 创建 一 个 整 型 对 象 ， 其 内 容 为 35， 同 时 创建 一 个 名 为 ra 的 变量 (对象 引用 )， 并 将 其 与 
这 个 整 型 对 象 进行 绑 定 ， 即 ra 引用 的 就 是 这 个 整 型 对 象 ， 如 图 2-1 所 示 。 

在 Python 中 所 有 的 数据 都 是 对 象 ， 赋 值 操作 符号 “=” 的 作用 是 ， 将 变量 和 内 存 中 的 某 
个 对 象 进行 绑 定 。 如 果 对 象 已 经 存在 ， 就 进行 简单 的 重新 绑 定 ， 以 便 引 用 “=” 右 边 的 对 
象 ， 如 果 对 象 引 用 尚未 存在 ， 就 首先 创建 对 象 ， 然 后 将 变量 和 对 象 进行 绑 定 。 这 很 类 似 于 C 
语言 中 指针 的 概念 。 
例如 : 


= 


rb=ra 


创建 了 一 个 名 为 tb 的 变量 ， 并 将 其 与 内 容 为 35 的 整 型 对 象 〈 已 经 存在 ) 绑 定 ， 如 图 2-2 所 示 。 


° 

sexe 变量 

图 2-1 变量 与 对 象 图 2-2 ”已 有 对 象 赋值 给 新 变量 

Python 中 基本 的 命名 规则 为 : 首 字母 为 英文 或 下 画 线 〈 即 _ )， 其 他 部 英文 、 

数字 和 下 夯 线 ， 而 变量 名 称 需 区 分 大 小 写 ， 即 变量 temp 5 Temp 为 不 同 变量 。 特 别 需 要 注意 
的 是 ， 系 统 关 键 字 不 可 以 用 作 变 量 名 ! 


下 面 是 一 个 计算 圆 面 积 的 程序 ， 代 码 为 ch2-1.py。 


Un + ÜQ N 一 


说 明 : 


# -*- coding: utf-8 -*- 
radius-input (u" 输 入 半径 : — ") 
radius float-float(raduis) 
area-radius float**2*3.1415926 
print w' 面 积 %f%( area ) 


1 行 ， 
2 行 


为 了 保证 源 程序 中 可 以 输入 汉字 。 
> XHM input. 函数 进行 半径 输入 ， 并 将 输入 结果 赋值 给 radius. u 表示 后 续 字 符 


为 Unicode 格式 。 变 量 radius 在 赋值 的 过 程 中 直接 创建 ， 不 需 变量 声明 。 


数 ， 


3 行 ， 
4 行 


也 可 执行 平方 运算 。 


51], 


Python 整数 类 型 包括 : 布尔 型 、 标 准 整 型 和 长 整 型 ， 下 面 将 逐一 介绍 。 


将 字符 串 转 换 成 浮 点 型 ， 之 后 赋值 给 出 radius float 变量 。 
， 进 行 面 积 计算 ， 其 中 radius float**2 为 平方 运算 ，Python 中 另 有 一 个 pow0 b 


将 计算 得 到 的 area 输出 到 控制 台 。 
3 


2.1.1 布尔 型 bool 
该 类 型 的 取 值 只 有 两 种 : 布尔 True 和 布尔 False， 在 数学 运算 中 对 应 着 整 型 的 1 O. 


SE bg 


示 上 布尔 


进行 真 假 的 逻辑 判断 。 


Fals 


布尔 小 


型 的 数据 支持 普通 整 型 的 所 有 计算 ， 即 False+l 之 类 的 计算 。 但 布尔 型 的 用 途 是 


任何 
e。 


下 面 


型 是 整 型 的 子 类 ， 但 不 能 再 被 继承 而 生成 它 的 子 类 。 
值 为 零 的 数字 或 空 集 《 空 列 表 、 空 元 组 和 空 字典 等 ) 在 Python 中 的 布尔 值 都 是 


是 一 些 布尔 型 的 应 用 例子 。 


# 布尔 类 型 应 用 示例 
>>>bool(2) 
True 
>>>bool('w') 
True 
>>>bool('0') 
True 
>>>bool(0) 
False 
>>>bool([]) 
False 

>>> x-34 
>>> fx-x220 


I fx 


True 
>>> y-fx--60 
>>> y 
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61 

>>> print '%s' %fx 
True 

>>> print '%d' %fx 
1 


2.1.2 基本 整 型 int 


Python 语言 的 基本 整 型 相当 于 C 语言 中 的 长 整 型 。 在 Python 3x 中 ， 可 以 使 用 下 列 语 名 
查看 自己 计算 机 中 Python 基本 整 型 数据 的 取信 范围 。 


>>> import sys 
>>> print (sys.maxsize) 
2147483647 


而 在 Python 2.x 中 ， 应 使 用 下 面 的 语句 : 


>>> import sys 
>>> print sys.maxint 
2147483647 


从 Python 2.2 起 ， 如 果 发 生 溢 出 ，Python 会 自动 将 基本 整 型 数据 转换 为 长 整 型 。 
Python 中 的 基本 整 型 数据 一 般 以 十 进 制 表示 ， 如 ; 
25, 90, -67, 8, 3456 
但 是 ，Python 也 支持 八进制 和 十 六 进 制 的 表示 形式 。 
八进制 的 基本 整 型 数字 以 数字 “0o” 开 始 (Python 2 使 用 “0” 后 来 Python 3 在 此 基础 
上 增加 英文 字母 “o” 并 将 该 方式 反馈 给 Python 2)， 如 : 


0067. 0045, -0034 
十 六 进 制 的 基本 整 型 数字 以 “0x” 或 “0X” 开 始 ， 如 : 
0x96，-0X56，0xA8，0xCB 


十 六 进 制 中 ， 字 母 A、B、C、D、E、F 或 a、b、c、d、e、f， 分 别 代 表 10、11、12、 
13、14、15。 
可 利用 赋值 的 方法 创建 整 型 变量 ， 如 : 


>>>x=45 

2.1.3 长 整 型 

Python 2 没有 限定 长 整 型 数字 的 表示 范围 ， 所 以 Python 的 长 整 型 数字 能 够 表达 的 数值 仅 
与 计算 机 所 支持 的 (虚拟 ) 内 存 的 大 小 有 关 ， 因 此 Python 能 够 表达 很 大 的 整 型 数字 。 

Python 中 ， 在 一 个 整 型 数字 的 后 面 加 工 或 1 (小 写字 母 )， 表 示 这 个 数字 为 长 整 型 数 
字 。 长 整 型 数字 也 支持 十 进 制 、 八 进 制 和 十 六 进 制 的 表示 形式 ， 如 : 

十 进 制 : 456L, 23L, -789056L 
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八进制 : 0123L, 056L, -0345L 
十 六 进 制 : -0x23dL, 0X67A8 
Python 3 中 基本 整 型 和 长 整 型 统一 成 一 种 类 型 ， 即 只 有 int 型 ， 并 表示 为 长 整 型 数据 。 


2.1.4” 双 精度 浮 点 型 float 


Python 使 用 双 精 度 浮 点 数 来 存储 小 数 。 双 精度 浮 点 型 类 似 C 语言 的 double 类 型 ， 可 以 
直接 用 十 进 制 小 数 形式 或 科学 计数 法 表示 。 在 C 语言 中 ， 每 个 双 精 度 浮 点 型 对 象 占 8 个 字 节 
(64 位 )， 遵 守 IEEE 754 标准 (52M/11E/1S)，64 位 存储 空间 分 配 了 52 位 来 存储 浮 点 数 的 
有 效 数字 ，11 位 存储 指数 ，1 位 存储 正 负 号 。 在 Python 中 ， 双 精度 浮 点 型 的 精度 以 及 所 占 
字 节 数 依 赖 于 计算 机 架构 和 创建 Python 解释 器 的 编译 器 。 可 通过 如 下 形式 查看 所 占 字 节 数 : 


>>> a=3.14 
>>>a._ sizeof () 
24 


双 精 度 浮 点 型 十 进 制 小 数 形式 如 下 所 示 : 
1.0, 87... 56.7, -87.3 


双 精 度 浮 点 型 科学 计数 法 形式 中 ， 用 。 或 EE 表示 10 WRK TE e/E 和 指数 之 间 用 正 负 
号 (+/-) 表示 指数 的 正 负 《〈 正 号 可 以 省 略 )， 如 ; 


9.5e3，3.6E-9，-7.8E78 
也 可 以 用 Python 提供 的 内 建 函 数 float0， 将 整 型 的 数字 转换 为 浮 点 型 数据 ， 如 : 


>>> float(23) 
23.0 


2.1.5 TEREA Decimal 


Python 中 ， 双 精度 浮 点 型 数字 的 精度 是 有 限 的 ， 这 经 常 让 一 些 需 要 高 精度 (如 科学 计算 
或 金融 应 用 程序 》 的 程序 员 发 狂 ， 如 : 
>>> x=0.3 


>>> y-x/3 


>>>y 
0.09999999999999999 


如 前 所 述 ，Python 为 双 精 度 浮 点 型 数字 分 配 了 52 位 来 存储 浮 点 数 的 有 效 数 字 ， 虽 然 52 位 
有 效 数 字 看 起 来 很 多 ， 但 麻烦 之 处 在 于 ， 二 进 制 小 数 在 表示 有 理 数 时 极 易 遇 到 无 限 循 环 的 问 
题 。 其 中 很 多 在 十 进 制 小 数 中 是 有 限 的 ， 比 如 十 进 制 的 10， 在 十 进 制 中 可 以 简单 写 为 0.1， 但 
在 二 进 制 中 ， 需 要 写成 : 0.0001100110011001100110011001100110011001100110011001…“ 后面 
全 是 1001 循环 ) 。 因 为 浮 点 数 只 有 52 位 有 效 数字 ， 从 第 53 位 开始 ， 就 舍 入 了 。 这 样 就 造 
成 了 “ 浮 点 数 精度 损失 ”问题 。 舍 入 (round) 的 规则 为 “0 SO» 入 ”， 所 以 结果 有 时 会 稍 
大 一 些 有 时 候 会 稍 小 一 些 。 
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有 时 编写 程序 需要 指定 精度 ， 以 便 用 于 财务 计算 并 生成 可 预期 的 结果 。Python 为 此 提供 
了 男 一 种 数字 类 型 一 一 Decimal。Decimal 类 型 并 不 是 内 建 的 ， 因 此 使 用 它 的 时 候 需 要 导入 
decimal 模块 ， 并 使 用 decimal.Decimal() 来 存储 精确 的 数字 。 这 里 需要 注意 的 是 : 使 用 非 整 
数 参 数 时 要 记得 传 入 一 个 字符 串 而 不 是 浮 点 数 ， 否 则 在 作为 参数 的 时 候 ， 这 个 值 可 能 就 已 经 
是 不 精确 的 了 。 
将 上 面 的 浮 点 型 运算 改 为 十 进 制 浮 点 型 运算 : 


>>>from decimalimport * 
>>> x-Decimal('0.3") 

>>> y=x/Decimal(3) 

>>>y 

Decimal('0.1") 


再 补充 一 个 浮 点 型 运算 与 十 进 制 浮 点 型 运算 区 别 的 实例 如 下 : 


>>> 0.1+0.1+0.1-0.3 

5.551115123125783e-17 

>>> Decimal('0.1")-Decimal(0.1")-Decimal('0.2") 
Decimal('0.0") 


2.1.6 ”复数 Complex 


复数 在 科学 计算 及 机 械 、 电 子 等 行业 得 到 了 广泛 应 用 。 在 数学 概念 中 ， 一 个 复数 可 以 表 
示 为 实 部 + 虚 部 ， 即 xtyj， 其 中 x 是 实数 部 分 ，y 是 虚数 部 分 。 在 Python 中 使 用 复数 类 型 数 
字 时 ， 需 要 注意 以 下 几 点 ; 

(1) 复数 由 实数 部 分 和 虚数 部 分 构成 。 

(2) 表示 复数 的 语法 是 : realtimgj。 

G) 虚 部 不 能 单独 存在 ， 它 们 总 是 和 一 个 值 为 0.0 的 实 部 一 起 构成 一 个 复数 。 

(4) 实数 部 分 和 虚数 部 分 都 是 浮 点 数 。 

(5) 虚数 部 分 必须 有 后 级 j 或 Jo 

Python 可 以 正确 使 用 的 复数 形式 如 下 : 


4.5+3j, 45.6-6.7J],0.67+6.8e4J，6.566+3.45j 
可 以 使 用 直接 赋值 的 方法 创建 复数 型 变量 ， 如 下 : 


>>> x=0.67+6.8e4j 


(0.67--68000j) 
1. 复数 的 内 建 属性 
复数 对 象 拥有 重要 的 数据 属性 real 和 imag， 分 别 表示 该 复数 的 实 部 和 虚 部 。 使 用 方法 


如 下 : 


>>> x=0.67+6.8e4j 
>>> x 
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$23 数据 类 型 


(0.67+68000j) 
>>> x.real 
0.67 

>>> x.imag 
68000.0 


2. 复数 的 内 建 方法 
在 编写 程序 时 ， 经 常 需要 用 到 复数 的 共 斩 复 数 。Python 为 复数 类 型 提供 了 conjugate 77 
ik. Win wk EOS SR. W: 


>>> x-0.674-6.8e4j 


>>> y-x.conjugate() 


DUM y 
(0.67-68000j) 


247 算术 运算 符 

Python 语言 中 的 算术 运算 符 有 +、-、*、/、%、** 和 //， 其 中 整除 运算 符 // 是 从 Python 
2.2 起 新 增加 的 运算 符 。 同 时 Python 也 支持 简单 的 单 目 (只 需要 一 个 操作 数 〉 运算 符 + 和 -。 
各 运算 符 的 功能 见 表 2-1 (假设 x=8, y=3), 


表 2-1 算术 运算 符 功 能 描述 


运算 符 功能 描述 示 dl 
m Tei 8**3=8°=512 
+ CH) 保持 操作 数 的 符号 不 变 ， 常 省 略 x=+8 等 价 于 x-8 
- GH) 改变 操作 数 的 符号 z=-x 则 z=-8 
区 乘法 运算 x*y-8*3-24 
i 除法 运算 ， 若 两 个 操作 数 都 是 整数 则 除 为 “地 板 除 ”( 见 x/y=8/3=2 — -xly--8/3—-3 
表 后 说 明 )， 和 否则 为 真正 除 8.0/3=2.6666666666666665 
« MAG TA P p x/y-8/3-2 -x/y7-8/37-3 
i "ERO Usu 8.0/3-20  8/-3.0-3.0 
0 ov 相册 二 x%y=8%3=2 
2 BUR x%y 相当 于 x- @//y)*y 8.3943-8.3- (8.3//3)*3=2.3 
+ OD 求 两 个 操作 数 的 和 xty-ll 
- (R) 求 两 个 操作 数 的 差 x-y-5 
说 明 : 


(1)“ 地 板 除 ”(floor) 是 指 取 比 商 小 的 最 大 整数 ， 如 5//2=2， 
-5//2=-3。 注 意 : 运算 符 /在 Python2.x 和 Python3.x 中 有 所 区 别 。 
在 Python3.x 中 ， 运 算 符 /对 应 着 真正 的 除法 ， 即 1/2=0.5。 但 在 


*,/,//,%0 


Python2.x 中 ， 如 果 运 算 符 / 的 两 个 操作 数 都 是 整数 ， 则 为 地 板 | 


除 ， 即 12-0， 如 果 运 算 符 /的 两 个 操作 数 中 有 浮 点 数 ， 其 才 为 

真正 的 除法 。 在 Python2 中 可 通过 from future import division 

将 / 改 为 真正 的 除法 。 
(2) 表 中 运算 符 的 优先 级 由 上 至 下 依次 递减 ， 如 图 2-3 所 示 。 图 2-3 算术 运算 符 优先 级 
其 中 窜 运 算 符 和 一 元 操作 符 ( 正 号 和 负 号 ) 之 间 的 优先 级 比 
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较 特 别 : 


优先 级 高 。 具 体 见 下 例 : 


窜 运 算 符 比 其 左 侧 操 作 数 的 一 元 运算 符 优先 级 低 ， 比 其 右 侧 操作 数 的 一 元 运算 符 的 


>>> 2**3 
8 


>>> -2**3 #4H = F-(2**3) 


-8 


>>> 2**.3 IH T 2**(-3) 


0.125 


YE: 


在 算术 运算 


， 通 常 要 求 操作 数 的 类 型 一 致 ， 如 果 类 型 不 一 致 ，Python 会 检查 一 个 操作 


数 是 否 会 转换 成 另 一 个 类 型 的 操作 数 ， 如 果 可 以 ， 则 将 操作 数 转 换 成 相同 类 型 并 求 结果 。 在 


Python ! 


在 Python ! 
型 (在 整 型 的 后 


某 些 转换 是 不 可 能 的 ， 比 如 将 一 个 复数 转换 为 非 复 数 类 型 。 
两 个 不 同类 型 的 操作 数 在 表达 式 中 相遇 时 的 转换 规则 是 : 整 型 转换 为 浮 点 
面 加 个 “.0” 即 可 )， 非 复数 转换 为 复数 《加 个 “0j” 的 虚数 部 分 )。 上 其 体 的 


转换 规则 如 下 : 
如 果 有 一 个 操作 数 是 复数 ， 则 另 一 个 操作 数 转 换 为 复数 。 否 则 ， 如 果 有 一 个 操作 数 是 浮 


点 型 ， 则 另 一 个 ] 
转换 为 长 整 型 。 否 则 ， 两 者 必然 者 
除了 让 Python 对 操作 数 进行 


操作 数 转换 为 浮 点 型 。 否 


2.48 ”数字 类 型 函数 
Python 既 提 供 了 数字 类 型 转换 的 内 建 函 数 ， 也 提供 了 执行 常用 数值 运算 的 内 建 函 数 。 
1. 转换 工厂 函数 


的 数值 类 型 ， 


们 被 调 
实例 : 
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>>> int(3.4) 

3 

>>> int(3.9) 

3 

>>> float(5) 

5.0 

>>> float(-78) 

-78.0 

>>> complex(5) 

(5*0j) 

>>> complex(5,8) 

(5*8j) 

>>> complex(-5.67,2.3e12) 
(-5.677--2300000000000j) 


则 ， 如 果 有 一 个 操作 数 是 长 整 型 ， 则 另 一 个 操作 数 


是 普通 整 型 ， 无 须 类 型 转换 。 


动 转换 ， 也 可 以 利用 转换 函数 对 操作 数 进行 显 式 转换 。 


工厂 函数 int). longO. float(). complex()l bool0 可 以 将 其 他 类 型 的 数值 转换 为 相应 
之 所 以 把 它们 称 为 工厂 函数 ， 是 因为 虽然 它们 看 上 去 有 点 像 函 数 ， 但 当 它 
时 ， 却 生成 该 类 型 的 一 个 实例 ， 就 象 工厂 生产 产品 一 样 。 下 面 为 转换 函数 使 用 


>>> bool(5) 
True 

>>> bool(0) 
False 

>>> bool(-1) 
True 

>>> bool(1) 
True 


2. 功能 函数 
Python 有 五 个 内 建 函数 用 于 数值 运算 : 


abs(), coerce(), divmod(), powO 和 round(). 


(1) 函数 abs0 返 回 给 定 参 数 的 绝对 值 。 如 果 参 数 是 一 个 复数 ， 那 么 就 返回 复数 的 模 ， 


即 复数 的 实 部 与 虚 部 的 平方 和 的 正 的 平方 根 。 例 : 


>>> abs(-1) 

1 

>>> abs(4.5) 

4.5 

>>> abs(-56.78e-2) 
0.5678 

>>> abs(23+6.78]j) 
23.978498701962142 
>>> abs(344J) 

5.0 


(2) 函数 coerce() (Python 2 中 的 函数 ) 返回 一 个 包含 类 型 转换 完毕 


元 组 。 例 : 


>>> coerce(2.0,33) 
(2.0, 33.0) 

>>> coerce(2,33) 

(2, 33) 

>>> coerce(2L,33) 
QL, 33L) 

>>> coerce(2L,33.0) 
(2.0, 33.0) 

>>> coerce(243j,33) 
(Q*3j), (33+0))) 

>>> coerce(273j,33L) 
(Q*3j), (33+0))) 

>>> coerce(2+3],33.0) 
(Q*3j), (33405) 


(3) 函数 divmod0 把 除 和 求 余 运 算 结 合 起 来 ， 返 回 


(nl,n2) 的 结果 为 (nlmn2，nl%n2)。 需 要 注意 的 是 : 在 Python 2 中 该 函数 支持 复数 ， 但 


Python 3 不 再 支持 复数 。 


的 两 个 数值 元 素 的 


一 个 包含 商 和 余数 的 元 组 。divmod 
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>>> divmod(4,3) 
(1, 1) 
>>> divmod(8.3,4) 


(2.0, 0.3000000000000007) 


>>> divmod(243j,2) 
((1+0j), 3j) 
>>> divmod(273),042j) 
((1+0)), (2+1))) 


A 


(4) 函数 pow0 类 似 操 作 符 **， 可 以 进行 指数 运算 ， 但 powQK ZOET URE 3 个 可 选 参 
数 ， 如 果 有 第 3 个 参数 ， 则 pow 先 对 第 1、2 个 参数 进行 指数 运算 ， 然 后 将 结果 对 第 3 个 参数 进 
行 求 余 运算 。 这 个 特性 主要 用 于 密码 运算 ， 并 且 比 pow(xyy) %z 性 能 更 好 。 例 如 : 


>>> pow(2,3) 

8 

>>> pow(2.3,2) 
5.289999999999999 
>>> pow(2,3,5) 

3 

>>> pow(2+3j,2) 
(-5412j) 


(5) 函数 round0 用 于 对 浮 点 数 进行 


果 不 提供 小 数位 参数 ， 它 返 


Mr H 


器 与 第 一 个 参数 最 接近 的 整数 


告诉 round 函数 将 结果 精确 


>>> round(2.45) 

2.0 

>>> round(2.45678) 
2.0 

>>> round(2.45678,2) 
2.46 

>>> round(-2.45) 

-2.0 

>>> round(-2.45678,1) 
-2.5 

>>> round(-2.45678,2) 
-2.46 


2.2 序列 


四 售 五 入 运算 。 


它 有 一 个 可 选 的 小 数位 数 参数 。 如 
昌 仍 然 是 浮 点 类 型 )。 第 二 个 参 


到 小 数 点 后 指定 位 数 。 例 如 : 


Python 序列 包括 元 组 、 列 表 和 字符 串 。Python 序列 类 型 都 是 由 一 些 成 员 共 同 组 成 的 一 个 
序列 整体 ， 它 们 的 成 员 都 是 有 序 排列 的 。 所 有 的 序列 类 型 都 支持 索引 操作 和 切片 操作 。 索 引 


操作 允许 从 序列 ! 


也 可 通过 len0 函 数 获 取 序 列 ! 
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抓 取 一 个 特定 项 目 ， 切 片 操 作 允 许 获 取 序 列 的 一 个 切片 ， 即 一 部 分 序列 。 


的 子 项 个 数 。 


序列 共同 支持 的 操作 符 见 表 2-2， 其 中 seq 代表 序列 对 象 。 


表 2-2 序列 操作 符 


序列 操作 符 功 能 说 明 
seq[index] 获取 seq 中 index 处 的 元 素 Ne Ps ANN e 5 
: ; . E TEE: 索引 值 index1、index2 为 整 型 数字 ， 正 向 索引 从 0 
E E Ú 3 
seq[index]:index2] 获取 index1 与 index2-1 之 间 的 元 素 开始 ， 反 向 索引 从 -1 开始 
seq*expr 复制 expr 份 的 seq expr 为 整 型 数字 
seql+seq2 连接 两 个 序列 segl. seq2 为 相同 类 型 序列 对 象 
obj in seq 判断 obj 是 否 为 seq 中 的 成 员 obj. seq 为 相同 类 型 序列 对 象 
obj not in seq 判断 obj 不 是 seq 中 成 员 obj. seq 为 相同 类 型 序列 对 象 


K 2-2 中 的 seq[index] 与 seq[indexl:index2] 为 切片 操作 ， 切 片 操 作 分 为 : 


e jE 


H 


FE 向 索引 : 索引 


什 范 围 从 0 到 偏 移 量 最 大 值 〈 比 序列 长 度 小 1 )。 


e AS: 索引 值 范围 从 -1《〈 最 后 一 个 元 素 的 索引 ) 到 序列 的 负 长 度 《〈 第 一 个 元 素 


的 索引 )。 
e NR 


整个 序列 。 


切片 中 起 始 索引 和 结束 索引 都 是 可 省 略 的 ， 如 果 省 略 起 始 索引 ， 则 从 序 
列 的 最 开始 处 开始 ， 如 果 省 略 结束 索引 则 取 到 序列 的 最 末尾 结束 ， 如 果 都 省 略 则 取 


在 切片 索引 的 


E 向 索引 中 ， 起 始 索引 可 以 小 于 0， 相 当 于 0， 结 束 索 引 可 以 大 于 偏 移 量 


最 大 值 ， 相 当 于 偏 移 量 最 大 值 。 也 可 以 在 切片 操作 中 增加 第 3 个 参数 ， 用 来 指定 切片 的 步 
长 ， 即 seq[indexl:index2:step]。 


K 2-2 中 的 seq[index] 索 引 操作 可 看 作 是 特殊 的 切片 操作 ， 只 切片 一 个 元 素 ， 但 索引 值 


必须 在 从 0 到 侦 移 量 最 大 值 或 从 -1 到 序列 的 负 长 度 的 有 效 范 围 内 ， 否 则 会 报错 。 


在 后 面 字符 串 、 列 表 和 元 组 类 型 的 讲解 中 会 详细 讲解 序列 操作 符 。 


序列 共同 支持 的 函数 见 表 2-3， 其 中 seql, seq2 代表 序列 对 象 。 


表 2-3 序列 共同 支持 的 函数 
功 能 说 BJ 


emp(seql,seq2) 


mE JS Wk CERO. He, EUEIGUCACI WREE 
比较 序列 seql 和 seq? 的 大 小 | su Egg, MH — 


lensegl) 获取 序列 的 长 度 A 5 GST 
WR seql 为 字符 串 ， 则 返回 字符 串 中 ASCI 码 最 大 或 最 小 
max(seq1l) 或 min(seq1) 求 最 大 值 或 最 小 值 的 字符 ， 否 则 返回 序列 中 的 最 大 或 最 小 元 素 ， 也 可 以 求 多 个 序 
列 的 最 大 或 最 小 序列 
WR seql 为 字符 串 ， 则 返回 由 小 到 大 排列 的 len(seq 了 ) 个 字 
sorted(seq1) 按照 由 小 到 大 的 顺序 进行 排列 | 符 串 ， 分 别 为 字符 串 中 各 字符 ， 和 否则 返回 由 小 到 大 排列 的 序列 
中 的 各 元 素 
sum(seq1) 求 和 对 数字 型 列表 或 元 组 中 的 各 元 素 进行 求 和 运算 


list(seq1)3X tuple(seq1) 


列表 或 元 组 


通过 浅 拷贝 数据 创建 一 个 新 的 |。 通常 用 于 将 元 组 转换 为 列表 ， 或 将 列表 转换 为 元 组 


X 2-3 中 的 emp(segl,seq2). max(segl). min(segl). sorted(seq1) 5 KZO / F9] JG 38 
大 小 的 问题 ， 如 果 序 列 
应 元 素 的 值 ， 如 果 对 应 元 素 的 类 型 不 同 ， 则 比较 遵守 下 列 规则 ; 


是 字符 串 ， 则 比较 各 字符 的 ASCH 码 值 ， 如 果 是 列表 或 元 组 则 比较 相 
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(D 均 为 数字 ， 则 强制 类 型 转换 后 ， 比 较 大 小 。 

(2) 若 一 方 为 数字 ， 则 另 一 方 大 ， 因 为 不 同类 型 元 素 比 较 中 数字 是 最 小 的 。 
(3) 如 果 均 不 是 数字 ， 则 通过 类 型 名 字 的 字母 顺序 进行 比较 。 

(4) 如 果 一 方 尚 有 元 素 ， 另 一 方 已 至 列表 末尾 ， 则 先 结束 的 小 。 


2.2.1 字符 串 


^I r] 


Python HFN 


> 


Tj. HH: 


>>> y-"yueoeo 
jeekrk 
nt 


eler 
>> y 


'yueoeo njeekrk nelerk' 


Python 中 有 三 类 字符 串 : 通常 意义 字符 串 、 原 始 字符 串 和 Unicode 字符 串 。 
通常 意义 字符 串 即 用 单 引号 、 双 引号 和 三 引号 界定 的 文本 ， 如 : 


>>> 'hello' 
'hello' 

>>> "world" 
"world' 

>>> "hello 
world" 
'helloinworld' 


表示 和 存储 文本 ， 用 单 引号 、 双 引号 和 三 引号 作 字符 串 的 界定 符 。 其 


单 引 号 和 双 引 号 作 界 定 符 的 作用 基本 相同 ， 三 引号 通常 用 作 包含 多 行文 本 字符 有 


的 界定 


原始 字符 串 是 以 R nk r 开始 的 字符 串 ， 不 对 其 中 的 转 义 字符 进行 转 义 〈 常 见 的 转 义 字符 


符 都 是 直接 按照 字面 的 意思 来 使 用 ， 即 没有 转 义 和 不 能 打印 的 字符 。 如 : 


>>> s='hellonworld' 
>>> print (s) 

hello 

world 

>>> ss-r'hellonworld' 
>>> print (ss) 
hellonworld 


! 于 变量 ss 指向 的 是 原始 字符 串 ， 所 以 print 输出 时 “\n” 没 有 转 义 为 换行 。 


有 : mn 换行 、\ 反 斜 杜 、tt 制 表 、\ 单 引号 、Yr 回 车 、\" 双 引号 )。 在 原始 字符 串 中 ， 所 有 的 字 


Unicode 是 书写 国际 文本 的 标准 方法 ， 如 果 文 件 中 含有 非 英 语文 本 ， 就 必须 使 用 


Unicode 字符 串 。Unicode 字符 串 是 以 U 或 u 开始 的 字符 串 ， 如 : 


>>> u'hello' 
u'hello' 
>>> U'hello' 
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普通 


如 果 


2 IY 


子 付 


如 果 


第 2 章 数据 类 型 


u'hello' 

把 一 个 普通 字符 串 和 一 个 Unicode 字符 串 做 连接 处 理 ，Python 会 在 连接 操作 前 先 把 
串 转 换 为 Unicode 字符 串 ， 如 : 

>>> U'hello'+'world' 


u'helloworld' 
>>> 'hello'+u'world' 


u'helloworld' 


字符 串 的 前 面 有 u 或 者 U， 则 表示 该 字符 串 为 Unicode 原始 字符 串 


o 


1. 创建 字符 串 变量 


可 以 


Du IE 


子 付 
(1) 


也 


(2) 


使 用 直接 赋值 的 方法 ， 创 建 字符 串 变 量 ， 如 : 


>>> s-'hello' 

>>s 

'hello' 

>>> ss=str(56) BRA str 创建 一 个 字符 串 后 ， 将 其 赋值 给 ss 
>>> ss 

'56' 


>>> s-'world' 


CC 
E 

È 
SR 
= 
jt 
D: 


: 字符 串 创 建 后 就 不 能 改变 ， 如 果 想 改变 变量 引用 的 字符 串 ， 只 外 


使 用 变量 引用 新 的 字符 串 。 


字符 串 操 作 符 


PLEK 2-2 中 的 所 有 序列 操作 符 ， 如 : 
取 字 符 串 中 某 个 字符 

>>> s='hello' 

>>> s[4] 

'o' 

>>> s[0] 

ht 


可 以 使 用 反 向 索引 : 


>>> s[-1] 
'o' 
>>> s[-3] 
路 
>>> s[-5] 
'h' 


取 字 符 串 中 的 子 字符 


>>> s='hello' 
>>> s[1:3] 


1 


HH 


1 


el 
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>>> s[:4] 
'hell' 

2» s[:] 
'hello' 
>>> s[2:5] 
'llo' 


切片 时 ， 从 开始 索引 对 应 的 元 素 开 始 取 ， 取 至 结束 索引 -1 对 应 的 元 素 。 
通常 采用 的 是 正 向 索引 来 获取 字符 串 的 字 串 ， 有 时 也 采取 反 向 索引 操作 ， 如 ; 


>>> s[-5:-2] 
'hel' 

>>> s[-5:-1] 
'hell' 

>>> s[-3:-1] 
由 

>> s[:] 
'hello' 


兽 加 第 3 个 参数 ， 可 切取 不 连续 的 子 字 符 串 ， 如 : 


>>> x=have a nice day' 
>>> x[0:10:2] 
"hv T 
>>> x[::3] 
'he cd' 
G) 字符 串 重 复 
>>> s-'hello' 
>>> s*3 
'hellohellohello' 
>>> s*6 
'hellohellohellohellohellohello' 


(4) 字符 串 连接 


>>> s='hello' 
>>> ss='world' 


>>> S 十 SS 


PEN 


'helloworld' 
>>> x-"have "+"a nice day" 
>> x 


'have a nice day' 
Python 也 允许 在 源码 中 把 几 个 字符 串 连 在 一 起 写 ， 以 此 来 构建 字符 串 。 


>>> y-'have "a nice day' 


r ae y 


'have a nice day' 
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种 是 C# 形 式 的 “1{0}.format” 形 式 。 


(5) 成 员 操 作 符 (in，not in) 


>>> s='hello' 
>>> ss-'world' 
>>> 'or' ins 
False 

>>> 'or' In ss 
True 

>>> 'or' not in s 
True 

>>> 'or' not in ss 
False 


3. 格式 化 操作 符 〈%) 
Python 的 字符 串 格式 化 分 为 两 种 ， 一 种 是 “%” 形 式 类 似 C 语言 的 printf 函数 ， 另 外 一 


虽然 Python 的 设计 者 曾经 谈 及 % 格 式 将 逐渐 消失 ， 但 % 


格式 存在 于 大 量 的 Python 代码 中 ， 即 使 到 了 Python 3.4，% 格 式 依 旧 存 在 于 大 量 的 Python 标 


准 库 中 ， 所 以 本 节 以 经 典 的 % 格 式 进行 i 
格式 化 操作 符 的 使 


其 


LN 


格式 化 模板 % 转 


解 。 


用 格式 为 : 
换 参 数列 表 


中 格式 化 模板 由 普通 字符 


Dl 


， 并 说 明 真 实数 值 


W 1⁄5: 


pami; 


通 字符 
现 的 格式 。 各 符号 


表 2-4 字符 串 格 式 化 符号 


和 包含 % 的 格式 化 符号 组 成 ， 这 些 格式 符 为 真实 值 预 留 位 
的 意义 见 表 2-4。 


格式 化 符号 转换 方式 

%s RIH str0 函 数 进行 字符 串 转换 
%r 优先 用 reprO 函 数 进 行 字符 串 转 换 
%c 转换 成 单个 字符 
%d 转换 成 十 进 制 整数 
%i 转换 成 整数 
%o 转换 成 八进制 整数 
%x 转换 成 十 六 进 制 整数 
%e 转换 成 指数 底数 写 为 e) 
%E 转换 成 指数 〈 底 数 写 为 E) 
vof 转换 成 浮 点 数 
%F 转换 成 浮 点 数 ， 与 上 相同 
%g 根据 显示 长 度 ， 转 换 成 指数 (e) 或 浮 点 数 0)， 不 输出 无 意义 的 零 
%G 根据 显示 长 度 ， 转 换 成 指数 (E) 或 浮 点 数 )， 不 输出 无 意义 的 零 
%% 输出 字符 "%" 

使 用 格式 化 操作 符 的 具体 例子 如 下 所 示 。 


>>> 'T love %s'%'China' 


'I ove China' 


>>> 'I love %r'%'China' 
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"I love 'China"" 
>>> 'ASCII(%c)=67'%67 
'ASCII(C)=67' 
>>> '%d'%0o23 
']9' 

>>> !%1'%23 
23 

>>> $0 93456 
'3456' 

>>> 6-123 
'-123' 

>>> '%o'%23 
'27' 

>>> '%0'%0023 
23 

>>> '%o'%0xA3 
'243' 

>>> '%x'%23 
'17' 

>>> '%x'%0o23 
13! 

>>> '%x'%0x23 
23 

>>> !'%%%c get a charactor'?o'c' 


'%c get a charactor' 


可 以 用 如 下 辅助 符号 ， 


对 格式 进行 进一步 的 控制 : 


% [flags][width].[precision]typecode 


说 明 : 
(1) flags 可 以 是 +、 


的 左 侧 填 


充 一 个 空格 ， 从 而 与 负数 对 齐 。0 表示 使 用 0 填充 。 
(2) width 表示 显示 宽度 。 

(3) precision 表示 小 数 点 后 精度 。 

具体 的 格式 化 操作 符 的 辅助 符 见 表 2-5. 


表 2-5 格式 化 操作 符 辅助 符 


' ' 或 0。+ 表 示 右 对 齐 。- 表 示 左 对 齐 。 


' 为 一 个 空格 ， 


表示 如 
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符 ”号 作 

mn m 指定 显示 宽度 ，n 指定 小 数 点 后 位 数 
Š 左 对 齐 ， 空 格 填 在 右 侧 

+ 在 正 数 前 面 显示 加 号 (+) 

" 在 正 数 前 面 显示 空格 

# 在 八进制 前 面 显示 '0'， 在 十 六 进 制 前 面 显 示 '0x' 或 '0X' 
0 显示 的 数字 前 面 填充 '0' 而 不 是 默认 的 空格 

(var) 映射 变量 (字典 参数 ) 


使 用 格式 化 操作 符 的 辅助 


>>> '%5.2f%3.456789 
' 3.46' 

>>> '%9.1f'%3.456789 
j 3.5' 

>>> '%-9.1f%3.456789 
13:3 h 

>>> '%+9.1f'%3.456789 
i F3! 

>>> '% u'%35 

'35' 

>>> '%d'%-35 

135 

>>> '%#o!'%45 

'055' 

>>> '%#x'%45 

'Ox2d' 

>>> 9409.1f963.456789 


+J = H 


'0000003.5' 


dices att. 
YES: 


>>> '%*f%(5,2.3) 
2.300000' 
>>> '%.*f%(2,2.3456) 
2.35! 
>>> '%* *f905.2 2 345678) 


"2; 


35' 


>>> '%*.*f%(7,2,2.345678) 
2.35' 


1 


综 上 所 述 ，Python 中 内 置 的 % 操 作 符 可 用 于 格式 化 字符 串 操 作 ， 控 
4. 比较 操作 符 


体例 子 如 下 所 示 。 


表 2-5 中 的 mn 分 别 表示 宽度 和 小 数位 数 ， 可 以 用 * 来 动态 地 代入 这 两 个 量 ， 例 如 


Jj 


字符 串 的 呈现 格式 。 


在 Python 中 可 以 用 标准 的 比较 操作 符 来 比较 字符 串 的 大 小 。 字 符 串 比较 大 小 是 从 左 至 
右 依次 比较 字符 串 中 字符 的 ASCII 值 的 大 小 。 标 准 的 比较 操作 符 见 表 2-6. 
表 2-6 标准 的 比较 操作 符 

操 作 符 功 能 
< 小 于 
> 大 于 
< 小 于 或 等 
大 于 或 等 
不 等 于 


不 等 于 (Python 2) 
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Python 3 不 再 支持 <> 操 作 符 ， 而 Python 2 既 支 持 != 也 支持 <>。 
字符 串 比较 的 例子 如 下 : 


>>> 'hello'>'world' 
False 

>>> 'hello'>'hei' 
True 

>>> 'horse'!='house' 
True 

>>> 'horse'—'house' 


False 


5. 字符 串 内 建 函 数 


字符 串 的 内 建 函 数 实际 是 字符 串 对 象 的 方法 ， 使 用 格式 为 “字符 串 对 象 名 .函数 名 0”。 
Python 提供 了 很 多 字符 串 函数 ， 可 以 完成 对 字符 串 的 各 各 操作 。 下 面 按照 操作 需求 对 这 


些 函 数 进行 讲解 。 
(1) 字符 串 去 空格 (strip, Istrip, rstrip) 


strip 去 掉 字 符 串 左 侧 和 右 侧 的 空格 〈 包 括 空格 键 、Tab 键 和 回 车 键 )，lstrip 


左 侧 的 空格 ，rstrip 去 掉 字 符 串 右 侧 的 空格 。 
例 : 


>>>a 
'\t errt \t' 

>>> a.strip() 
'errt' 

>>> a.lstrip() 
'errt \t' 

>>> a.rstrip() 
t errt' 

>>> b='hell' 
>>> b.strip('h') 
'ell' 


yu 
ra 
H 
X 
B 


如 果 在 strip. strip. rstrip 函数 的 参数 中 给 出 特定 字符 串 ， 这 三 个 函数 也 可 以 完成 删除 


特殊 字符 的 功能 。 


>>> a.Strip(\t) 
Et 

>>> alstrip(\t) 

' errt V' 

>>> a.rstrip('t X") 


^t err 


(2) 连接 字符 串 Goin) 
除了 使 用 操作 符 “+” 实 现 字符 串 连接 功能 ， 也 可 以 使 用 join 函数 
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>>> a-'hello' 

>>> a.join(('ab','cd','ef)) 
'abhellocdhelloef 

2a 

'hello' 

>>> b-a.join(('ab','cd','ef")) 
>> b 

'abhellocdhelloef 

>>> c=".join(('ab','cd','ef )) 
>>> c 

'abcdef' 


例 中 join 函数 的 参数 为 列表 ， 列 表 的 知识 将 在 下 一 小 节 中 讲解 。 

使 用 join 函数 和 “+” 连 接 字 符 串 的 区 别 在 于 ，join 将 所 有 字符 串 连 接 在 一 起 后 ， 生 成 
一 个 新 的 字符 串 对 象 ， 而 “+” 则 每 连接 两 个 字符 串 就 需要 产生 一 个 新 的 字符 串 对 象 ， 所 以 
在 需要 连接 多 个 子 字符 串 时 ， 一 般 使 用 join 函数 。 当 然 也 可 以 使 用 字符 串 格式 化 操作 符 
"997, 将 多 个 字符 串 连接 在 一 起 ， 如 : 

>>> '%s%s%s'!'%(a,'ab','cd') 

'helloabcd' 


使 用 字符 串 格 式 化 操作 符 “%” 进 行 字符 串 连接 效率 高 、 可 读 性 好 ， 并 且 可 以 自动 将 非 
字符 串 的 对 象 转换 为 字符 串 后 连接 ， 如 : 


>>> '%s%s%s'%(a,'ab',34) 
'helloab34' 


同样 的 连接 ， 使 用 join 函数 时 会 报错 : 


>>>" join((a,'ab',34)) 


Traceback (most recent call last): 
File "<pyshell#20>", line 1, in <module> 
" join((a,'ab',34)) 
TypeError: sequence item 2: expected string, int found 


使 用 “+” 操 作 符 也 会 报错 : 


>>>a+'ab'+34 


Traceback (most recent call last): 
File "<pyshell#21>", line 1, in <module> 
a+'ab'+34 


TypeError: cannot concatenate 'str' and 'int' objects 


(3) DAHA (split, rsplit, splitline) 
split 函数 的 使 用 格式 为 : 
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string.split(str,num) 
功能 : 以 str 为 分 隔 符 切 片 string， 如 果 指 定 num， 则 仅 分 割 num 个 子 字符 串 。 


>>> b='I am a student' 
>>> b.split(' ') 

l'I, 'am', 'a', 'student'] 
>>> b.split(' ',2) 


[T 'am', 'a student'] 


rsplit 函数 与 split 基本 相同 ， 区 别 在 于 当 numcstring.count(str)H], split 是 从 左 向 右 分 割 
子 字符 串 ， 而 rsplit 是 从 右 癌 左 分 割 子 字符 串 。 


>>> b.rsplit( ") 
[ T, 'am', 'a', 'student'] 
>>> b.rsplit( ',2) 


+ tal 8 


[1 am", 'a', 'student'] 


splitline 函数 的 使 用 格式 为 : 


string.splitline(num) 


功能 : 按照 行 切片 string， 返 回 一 个 以 各 行内 容 为 元 素 的 列表 ， 如 果 指 定 num， 则 仅 切 
Fr num 行 。 


>>> d.splitlines() 
[T', 'am', 'a', 'student'] 


(40 查找 字符 串 (find, index) 
find 函数 的 使 用 格式 为 : 


string.find(str,beg,end) 


功能 : 检测 str 是 否 包 含 在 string P, WRH beg 和 end 指定 范围 ， 则 会 检查 是 否 包含 在 
指定 范围 内 ， 如 果 是 ， 返 回 开始 的 索引 值 ， 否 则 返回 -1。 
例如 : 


>>> a-'hello world' 
>>> a.find('el',5,11) 
-1 

>>> a.find('el',0,11) 
1 


index 函数 的 使 用 格式 为 : 


string.index(str,beg,end) 


功能 : 与 find 函数 基本 相同 ， 只 是 如 果 在 string 中 找 不 到 str 会 报告 异常 。 
例 : 
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>>> a-'hello world' 
>>> a.index('el',0,11) 
1 


>>> a.index('el',5,11) 


Traceback (most recent call last): 
File "<pyshell#27>", line 1, in <module> 
a.index('el',5,11) 
ValueError: substring not found 


C5) 统计 子 字符 串 出 现 次 数 〈count) 
count 函数 使 用 的 格式 为 : 


string.count(str,beg,end) 


功能 : 统计 str 在 string 中 的 出 现 次 数 ， 如 果 用 beg 和 end 指定 范围 ， 则 返回 指定 范围 内 


str 出 现 的 次 数 。 
例 : 


>>> a-'hello world' 
>>> a.count(w',0,11) 
1 

>>> a.count(1,0,11) 
3 

>>> a.count('h') 

1 

>>> a.count('h',6,11) 
0 

>>> a.count('l',6,11) 
1 


(6) PRT TITE (replace) 
replace 函数 使 用 的 格式 为 : 


string.replace(str1 str2,num) 
功能 :把 字符 上 
num 次 。 


例 : 


p" 


>>> a-'hello world' 
>>> a.replace('l','r') 
'herro worrd' 

>>> a.replace('l','r',2) 
'herro world' 


C) 字符 串 的 测试 、 判 断 函 数 


中 的 字符 串 stri 替换 成 str2， 如 果 num 指定 ， 则 蔡 换 次 数 不 超 过 


string.startswith(str[,beg[,end]]) 检查 是 否 以 str A 


F 头 ， 如 果 指 定 beg 和 end， 则 在 指定 范 
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string.isalpha0 检 查 是 否 全 是 


| fe 
string.endswith(str[,beg[,end]]) 检查 是 否 
内 碍 找 。 

string.isalnumO 检 查 是 否 全 是 字母 和 数字 ， 


FEA str 结 


string.isdigitO 检 查 是 否 全 是 数字 ， 并 
string.isspace() 检 查 是 否 全 是 空 sm 并 至 少 
string.islower() 检 查 是 否 全 是 小 写 
string.isupper0) 检 查 是 否 全 是 大 写 。 
string.istitle0 检 查 是 否 首 字母 大 写 


例 : 


>>> a-'hello world' 
>>> a.startswith('h") 
True 

>>> a.endswith('h") 
False 

>>> a.isalnum() 
False 

>>> b-'helloworld' 
>>> b.isalnum() 
True 

>>> a.isalpha() 
False 

>>> b.isalpha() 
True 

>>> a.isdigit() 
False 

>>> c='1238' 

>>> c.isdigit() 
True 

>>> a.isspace() 
False 

>>> d=' L 

>>> d 

"f 

>>> d.isspace() 
True 

>>> a.islower() 
True 

>>> a.isupper() 
False 

>>> a istitle() 


False 


尾 ， 如 果 指 定 beg 和 end, 


并 至 少 有 一 个 字符 。 
FBE, HEDA SFR 
至 少 有 一 个 字符 。 


o 


则 在 指定 范 


围 


dt 


可 使 用 capitalize 函数 将 字符 串 的 首 字 符 改 成 大 写 ， 如 : 


>>> a-'hello world' 
>>> a.capitalize() 
'Hello world' 


2.2.2 ”列表 


列表 也 是 Python 中 常用 的 序列 类 型 ， 它 是 能 够 存储 任意 多 个 不 同 数据 类 型 对 象 的 容 
器 。Python 的 列表 有 点 像 C 语言 中 的 数组 ， 但 比 数组 灵活 ， 列 表 元 素 的 类 型 可 以 不 同 ， 还 可 


IRIS SANA. Als 


>>> ['we',34,'hello',6.78,2e-3] 
['we', 34, 'hello', 6.78, 0.002] 


1. 创建 列表 


REENE 


号 分 隔 的 各 数据 项 用 方 括号 [] 括 起 来 就 创建 了 一 个 列表 ， 也 可 以 用 工 


list 将 字符 串 转换 为 列表 。 例 如 : 


>>> ['Py 
[Python 
>>> x=[' 
>> x 

['we', 4.5 
2 y-li 


> e y 


thon',1,'C Language'2,'Java',3] 
, 1,'C Language", 2, 'Java', 3] 
we',4.5,you',7,['he','she']] 


, yov", 7, ['he', 'she']] 
st(world') 


['w', 'o', T, ua 'd'] 


2. 序列 操作 符 


列表 支持 表 
(1) 访问 或 


>>> x-[' 


2-2 中 的 所 有 序列 操作 符 ， 如 : 
修改 列表 中 某 个 值 


we',4.5,'you',7,['he','she']] 


>>> x[2] 


1 1 


you 


>>> x[4] 
['he', 'she'] 
>>> x[3]-26 


>> x 


['we', 4.5, 'you', 26, ['he', 'she']| 


列表 与 字符 
访问 但 不 能 改变 


以 用 用 户 定 义 的 对 象 作为 自己 的 元 素 。Python 使 用 方 括号 [ ] 作 为 列表 的 界定 符 ， 多 个 元 素 之 


如 果 列 表 
维 数 组 ， 如 : 


的 元 素 还 是 列表 ， 要 访问 其 中 的 值 ， 可 以 使 有 


以 改变 列表 中 的 值 。 
HZA Nin KA C 语言 


串 不 同 。 字 符 串 创建 后 就 不 能 改变 ， 但 是 列表 可 以 改变 ， 所 以 只 能 通过 索引 
字符 串 中 的 字符 ， 但 通过 索引 既 可 以 访问 也 可 


中 的 多 
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的 最 末尾 结束 。 
也 可 以 通过 切片 操作 ， 改 变 列 表 中 的 几 个 值 。 不 仅 可 以 改变 列表 元 素 的 值 ， 而 且 可 以 改 


>>> x[4][1] 
'she' 

>>> x[4][0] 
'he' 


(2) 列表 切片 
通过 切片 操作 符 从 列表 中 取出 子 列 表 ， 如 : 


与 


>> x 
['we', 4.5, 'you', 26, ['he', 'she']] 
>>> x[:4] 

['we', 4.5, 'you', 26] 

>>> x[3:] 

[26, ['he', 'she']] 

>>> x[-3:-1] 

['you', 26] 

2» x[:] 

['we', 4.5, 'you', 26, ['he', 'she']] 


字符 串 一 样 ， 列 表 的 切片 操作 也 遵从 正 负 索引 规则 ， 了 
个 元 素 为 -1， 如 果 在 切片 中 省 略 起 始 索 引 或 结束 索引 ， 则 从 列表 的 最 开始 处 开始 或 取 到 列表 


始 ， 负 索引 最 后 一 


变 列表 元 素 的 类 型 ， 如 : 
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(3) 


(4 


(5 


) 


NM 


>>> x[2:3]- [10,56] 
>> x 
['we', 4.5, rt, 56, 26, ['he', 'she']] 


列表 重复 


>>> x*2 
['we', 4.5, 'rt', 56, 26, ['he', 'she'], 'we', 4.5, 'rt', 56, 26, ['he', 'she']] 
>>> x[1:3]*3 


[4.5, 'rt', 4.5, 'rt', 4.5, 'rt'] 


列表 连接 


>>> y=list('world') 

>> y 

['w', 'o', r, T, 'd'] 

>>> x+y 

['we', 4.5, 'rt', 56, 26, ['he', 'she'], 'w', 'o', 'r', 1', 'd'] 


成 员 操作 符 Gn. notin) 


>>>yinx 


False 


>>> y not in x 
True 
>>> Tt in x 
True 
>>> Tt in x[2:] 
True 
>>> 'rt' in x[3:] 
False 
3. 比较 操作 符 
列表 也 可 以 使 用 表 2-6 中 的 标准 比较 操作 符 比 较 大 小 ， 比 较 规 则 与 内 建 函数 cmp() 比 较 
规则 相同 。 两 个 列表 比较 规则 为 : 从 左 至 右 依次 取出 对 应 的 列表 元 素 进行 比较 ， 直 到 比 出 大 
小 为 止 ， 如 果 直 到 最 后 一 个 元 素 都 相同 ， 则 两 个 列表 相同 。 在 比较 过 程 中 ， 如 果 对 应 元 素 的 
类 型 不 同 ， 则 比较 遵守 下 列 规则 : 
(1) 如果 均 为 数字 ， 则 强制 类 型 转换 后 ， 比 较 大 小 。 
(2) 如 果 一 方 为 数字 ， 则 另 一 方 大 ， 因 为 不 同类 型 元 素 中 数字 是 最 小 的 。 
(3) 如 果 均 不 是 数字 ， 则 通过 类 型 名 字 的 字母 顺序 进行 比较 。 
(4) 如 果 一 方 尚 有 元 素 ， 男 一 方 已 至 列表 末尾 ， 则 先 结束 的 小 。 
例 : 


>>> z=list('world') 
DD y—2 

True 

>>> x>y 

True 

2» x[ 1 :]>y 


False 


4. 列表 内 建 函 数 

列表 的 内 建 函数 实际 是 列表 对 象 的 方法 ， 使 用 格式 为 “列表 对 象 名 .函数 名 0”。 列 表 是 
多 个 多 种 类 型 元 素 的 容器 ， 创 建 后 可 以 改变 ， 可 以 利用 列表 内 建 函 数 对 列表 实现 追加 、 删 除 
和 插入 等 更 新 操作 。 

(1) append 函数 可 在 列表 后 添加 新 元 素 。 


>>> x=['e,78,'yu',456] 
>>> x.append('tyuu') 
>> x 

['e', 78, 'yu', 456, 'tyuu'] 


extend 函数 可 在 列表 后 追加 一 个 列表 的 全 部 元 素 。 


— 


(2 


>>> x=['e',78,'yu',456] 
>>> y=['a',123,'b',456] 
>>> x.extend(y) 
>> x 
['e', 78, yu, 456, 'tyuu', 'a', 123, 'b', 456] 
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(3) insert 函数 可 插入 新 元 素 。 


>>> y=['a',123,'b',456] 
>>> y.insert(2,'new") 
>> y 

['a', 123, new', 'b', 456] 


(4) pop 和 remove 函数 可 删除 元 素 

pop 函数 删除 指定 索引 值 所 对 应 的 元 素 ， 如 果 不 指定 索引 值 ， 默 认 删 除 最 后 一 个 元 素 。 
remove 函数 删除 指定 内 容 所 对 应 的 元 素 ， 如 果 列 表 中 多 个 元 素 与 指定 内 容 相 同 ， 则 只 删除 第 
一 个 与 指定 内 容 相 同 的 元 素 。 


Pop 举例 : 
>>> y-['a', 123, 'new', 'b', 456] 
>>> y.popÜ 
456 
>>> y 
['a', 123, 'new', 'b'] 
>>> y.pop(0) 
'a' 
>>> y 
[123, 'new', 'b'] 


remove 举例 : 


>>> z=['e','ty',78,'e',78,"10',67.4] 
>>> zremove('e) 

>> z 

['ty', 78, 'e', 78, 'io', 67.4] 

>>> zremove('e) 

>> z 

['ty', 78, 78, 'io', 67.4] 

>>> z.remove('io') 

>> z 

['ty', 78, 78, 67.4] 


(5) count 函数 可 统计 对 象 出 现 次 数 。 


>>> z.count(78) 
2 
>>> z.count('ty') 
1 
>>> z.count(45) 
0 


(6) index 函数 可 查找 对 象 。 
index 函数 的 使 用 格式 为 : 
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list.index(obj,i,j) 


要 求 i>=0, je-len(list), i<j 


作用 为 从 列表 的 第 1 个 〈 从 0 开始 计数 ) 元 素 开 始 查 找 对 象 obj， 查 到 第 j 个 元 素 结束 


(不 包括 第 j 个 元 素 )， 如 果 查 到 则 返回 元 素 的 索引 值 ， 否 则 会 引发 ValueError FEA o 


CD 


(8) 


LZ 

[67.4, io, 78, 'e', 78, 'ty', 'e'] 

>>> z index(78,3,6) 

4 

»»»z.ndex(78,3,4) 

Traceback (most recent call last): 

File "<pyshell#69>", line 1, in «module 

zndex(78,3,4) 

ValueError: 78 is not in list 

>>> z.index(78,3,5) 

4 


reverse 函数 可 翻转 列表 。 


T 


>> z 
['e', 'ty', 78, 'e', 78, 'io', 67.4] 
>>> zreverse() 

>>> z 

[67.4, 'io', 78, 'e', 78, 'ty', 'e'] 


sort 函数 可 进行 列表 排序 。 


sort 函数 的 使 用 格式 为 : 


作用 为 以 指定 的 方式 排序 列表 中 的 成 员 ， 如 果 key 参数 指定 ， 则 按照 指定 的 方式 比较 各 


个 元 素 ， 


list.sort(key-None,reverse-False) 


如 果 reverse 标志 设置 为 True， 则 列表 以 逆序 排列 。 


>>> z.sort(reverse-False) 
>>> z 

[67.4, 78, 78, 'e', 'e', io, ty] 
>>> z.sort(reverse-True) 
>>> z 

['ty', 'io', 'e', 'e', 78, 78, 67.4] 


5. 列表 实现 常见 数据 结构 


堆栈 和 队列 是 数据 结构 中 的 两 种 常见 结构 ， 因 为 列表 是 一 个 可 变 的 容器 ， 所 以 很 容易 使 


(1) 


列表 来 实现 堆栈 和 队列 的 功能 。 


堆栈 


始 删除 。 


堆栈 的 典型 特点 是 “后 进 先 出 ”， 添 加 新 元 素 时 ， 添 加 在 后 面 ， 删 除 元 素 时 ， 从 最 后 开 
下 面 用 列表 来 处 理 英文 歌曲 名 单 ， 处 理 过 程 满足 堆栈 特点 《代码 : ch2-2.py)。 
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#example 


songn=[] 


#add the song name 
while(1): 
newsong-raw input('Enter the name of song(if end,enter -1):') 


if(newsong--' -1^: 


break 


else: 


songn.append(newsong) 


#only keep 5 songs 


while(len(songn)»5): 
songn.pop() 
print songn 


运行 该 程序 ， 并 依次 输入 last christmas, all things bright and beautiful, burning, sweet 
chocolate, love fool, what hurts the most, sitting down here,-1， 结 果 如 下 : 


2» 


Enter the name of song(if end,enter -1):last christmas 


Enter the name of song(if end,enter -1):all things bright and beautiful 


Enter the name of song(if end,enter -1):burning 


Enter the name of song(if end,enter -1):sweet chocolate 


Enter the name of song(if end,enter -1):love fool 


Enter the name of song(if end,enter -1):what hurts the most 


Enter the name of song(if end,enter -1):sitting down here 


Enter the name of song(if end,enter -1):-1 


the 5 most popular song are: 


[last christmas", 'all things bright and beautiful', 'burning', 'sweet chocolate', 'love fool'] 


(2) 队列 
队列 是 一 种 “先进 先 出 ”的 数据 类 型 。 添 加 新 元 素 时 ， 添 加 在 后 面 ， 删 除 元 素 时 ， 从 最 
前 面 开始 删除 。 
下 面 用 列表 处 理 面试 排队 的 问题 Ch2-3.py)。 
#example 
itname=[] 
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import time 


#add the interview name 
while(1): 
newname-raw input('Enter the name of waiting for the Interview(if end,enter end):") 


if(newname--'end"): 


break 


else: 


itname.append(newname) 


#In front of the row of people to interview first 
while(len(itname)»0): 


name-itname.pop(0) 


print name,'take the interview' 
time.sleep(5)  £wait for 5 seconds 


运行 该 程序 ， 并 依次 输入 mike,john,janice,maryjennyend, “KM P: 


>>> 
Enter the name of waiting for the Interview(if end,enter end):mike 
Enter the name of waiting for the Interview(if end,enter end):john 
Enter the name of waiting for the Interview(if end,enter end):janice 
Enter the name of waiting for the Interview(if end,enter end):mary 
Enter the name of waiting for the Interview(if end,enter end):jenny 
Enter the name of waiting for the Interview(if end,enter end):end 
mike take the interview 

john take the interview 

janice take the interview 

mary take the interview 

jenny take the interview 


22.3 元 组 


元 组 与 列表 类 似 ， 也 是 一 种 容器 类 型 ， 但 两 者 有 本 质 的 区 别 : 列表 是 可 变 的 ， 而 元 组 是 
不 可 变 的 。Python 使 用 圆 括号 0 作为 元 组 的 界定 符 ， 如 : 


>>> (23''yu',67,w2") 

(23', 'yu', 67, w2") 
1. 创建 元 组 
只 要 把 用 逗号 分 隔 的 各 数据 项 用 圆 括 号 0 括 起 来 就 创建 了 一 个 元 组 ， 也 可 以 用 工厂 函数 
tuple 将 字符 串 或 列表 转换 为 元 组 。 例 如 : 


>>> (Python',1,C Language',2,'Java',3) 
(Python', 1, 'C Language', 2, 'Java', 3) 
>>> x=('we',4.5,'you',7,('he','she')) 
>> x 

(we', 4.5, you, 7, ('he', 'she")) 

>>> y-tuple('hello world") 

>>> y 

(he T, 00 5 "w', 'o', 'r', 1', 'd') 
>>> y-tuple(['hello'world',7,8,9]) 
>>> y 

('hello', 'world', 7, 8, 9) 


2. 序列 操作 符 


元 组 支持 表 2-2 中 的 所 有 序列 操作 符 ， 如 : 
(1) 访问 元 组 中 某 个 值 


>>> x=('we',4.5,'you',7,['he','she']) 
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最 后 一 个 元 素 为 -1， 如 果 在 切片 中 省 略 起 始 索引 或 结束 索引 ， 则 从 元 组 的 最 3 


>> x 
('we', 4.5, you, 7, ['he', 'she']) 
>>> x[3] 
7 
>>> x[3]-5 
Traceback (most recent call last): 
File "<pyshell#92>", line 1, in «module 
x[3]-5 
TypeError: 'tuple' object does not support item assignment 


只 能 通过 索引 访问 但 不 能 改变 元 组 中 的 元 素 。 


如 果 元 组 
的 多 维 数组 ， 如 : 


(2) 


的 元 素 还 是 列表 或 元 组 ， 要 访问 其 中 的 值 ， 可 以 使 用 多 维 下 标 ， 


>>> x[4][1] 
'she' 
>>> x[4][0] 
he 


元 组 切片 
切片 操作 符 从 元 组 中 取出 子 元 组 ， 如 : 


>>> x-('we', 4.5, you, 26, ['he', 'she']) 
>> x 

(we', 4.5, 'you', 26, ['he', 'she']) 
>>> x[:4] 

('we', 4.5, 'you', 26) 

>>> x[3:] 

(26, ['he', 'she']) 

>>> x[-3:-1] 

('you', 26) 

>>> x[:] 

(‘we', 4.5, 'you', 26, ['he', 'she']) 


类 似 C 语言 


与 字符 串 和 列表 一 样 ， 元 组 的 切片 操作 也 遵从 正 负 索引 规则 ， 正 索引 从 零 


开始 ， 负 索引 


到 元 组 的 最 末尾 结束 。 
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(3) 


(4) 


元 组 重复 


>>> x=('we', 4.5, you, 26, ['he', 'she']) 

>>> x*2 

('we', 4.5, 'you', 26, ['he', 'she'], 'we', 4.5, 'you', 26, ['he', 'she']) 
>>> x[1:3]*2 

(4.5, 'you', 4.5, 'you') 


元 组 连接 


>>> x-('we', 4.5, you, 26, ['he', 'she']) 


开始 处 开始 或 取 


$23 数据 类 型 
>>> y-tuple('hello") 
>>>y 
(h', 'e', T T, 'o') 
>>> x+y 


('we', 4.5, 'you', 26, ['he', 'she'], 'h', 'e', 'T', 'T', 'o") 


NM 


(5) 成 员 操作 符 Cin, notin) 


>>> x-('we', 4.5, you, 26, ['he', 'she']) 
>>> y-tuple('hello") 
>>> y inX 
False 
>>> y not in x 
True 
>>> 'rt'in x 
True 
>>> 'rt' in x[2:] 
True 
>>> 'rt' in x[3:] 
False 
3. 比较 操 作 符 
元 组 也 可 以 使 用 表 2-6 中 的 标准 比较 操作 符 比较 大 小 ， 比 较 规则 与 内 建 函 数 cmp0 类 
4l, Bl: 从 左 至 右 依 次 拿 出 对 应 的 元 组 元 素 进 行 比较 ， 直 到 比 出 大 小 为 止 ， 如 果 直 到 最 后 
个 元 素 都 相同 ， 则 两 个 元 组 相同 。 在 比较 过 程 中 ， 如 果 对 应 元 素 的 类 型 不 同 ， 则 比较 遵守 下 
列 规则 : 
(1) 若 均 为 数字 ， 则 强制 类 型 转换 后 ， 比 较 大 小 。 
(2) 若 一 方 为 数字 ， 则 男 一 方太， 因为 不 同类 型 元 素 比较 中 数字 是 最 小 的 。 
(3) 如 果 均 不 是 数字 ， 则 通过 类 型 名 字 的 字母 顺序 进行 比较 。 
(4) 如 果 一 方 尚 有 元 素 ， 男 一 方 已 至 元 组 末尾 ， 则 先 结束 的 小 。 
例 : 
>>>y=tuple(hello) 


>>> z-tuple(world') 
D» y=z 


True 

D» xy 
True 

>>> x[ 1 :]>y 


False 


在 Python 3.x 中 ， 如 果 比 较 运 算 符 (<, < =, > =, >) 的 操作 数 的 类 型 不 同 ， 将 引发 
TypeError 异常 。 例 如 : 表达 式 1<'l', 0>None 不 再 有 效 。 一 个 推论 是 除非 元 组 〈 链 表 ) 的 所 


不 适用 于 = = 和 ! = 运算 符 ， 因 为 不 同类 型 的 对 象 比较 时 总 是 不 相等 的 。Python 3.x 中 也 不 再 
支持 cmp0 方 法 ， 可 以 用 表达 式 (a > b) - (&<b) 代 替 cmp()。 


Python 即 学 即 用 


4. 元 组 的 可 变 对 象 


元 组 定义 后 是 不 可 变 的 ， 但 是 如 果 元 组 中 包含 了 可 变 对 和 象 如 列表 ， J 


时 ， 某 种 意义 上 讲 也 改变 了 元 组 。 
>>> x-('we', 4.5, you, 26, ['he', 'she']) 
>>> x[4][1]- they' 


>>> x 


('we', 4.5, 'you', 26, ['he', 'they']) 
>>> x[4][0]- it 


>> x 


('we', 4.5, 'you', 26, ['it', 'they']) 
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23 字典 


字典 (dicb 是 Python 中 的 映射 数据 
的 关联 数组 或 散 列 表 ，| 
可 以 是 任意 类 型 的 Python 对 象 。 
如 果 把 列表 和 元 组 当 作 有 序 的 对 象 

RE CRIN 来 存 取 元 素 对 象 ， 而 字典 则 根据 键 来 存 取 对 象 ， 所 以 字典 ， 
联系 人 姓名 与 联系 电话 一 一 对 应 ， 可 以 通过 


和 元 组 可 以 根据 1 
键 必须 是 叭 


的 。 这 有 点 类 似 1 
联系 人 的 姓名 查找 其 联系 ! 


Z. 上 


I0 


类 型， 


使 用 大 括号 全 作为 界定 符 ， 工 


BIE, 


Eiio 


2.3.1 字典 创建 


将 键 - 值 对 用 大 括号 (个 〉 括 起 来 就 创建 了 字典 对 象 ，Python 也 允许 
Bu, 


(>Z c 


IE 


创建 一 个 “ 


>>>d= ü 
>>> d 


Ü 


>>> d-(001:'mike'002:'mary'] 


>>> d 


(1: 'mike', 2: 'mary'} 
>>> d1={003:'"john',004:'jenny',005:'tom'} 


>>> dl 
(3: 'John', 4: 'jenny', 5: 'tom'} 
Germ, SE-LZ TRI] H2) B. HE-EDSEZL RISE 4 o 


也 可 以 使 用 工厂 函数 dict0 来 
dict() 创建 一 个 空 的 字典 。 
dict(mapping) fi: T] &&- [EDS] 81] E% 


dict(iterable) 利 
dict(**kwargs) 
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创建 字典 。 主 要 使 用 形式 如 下 : 


的 字典 。 
j 可 迭代 对 象 创 建新 的 字典 。 
使 用 键 - 值 对 创建 新 的 字典 。 


b 么 改变 


;界定 的 多 个 用 逗号 分 隔 的 对 象 都 当 作 元 组 来 处 理 。 
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可 变 对 象 


作 原 理 类 似 Perl 


键 - 值 Ckey-Value) 对 构成 ， 通 常 使 用 数字 或 字符 串 作 键 ， 而 值 
集合 类 型 ， 那 么 字典 就 是 无 序 的 对 象 集合 类 型 。 列 表 


的 


] 一 对 空 的 大 括号 


例 : 


2.3.2 


>>> d-dict() 

>>> d 

G 

>>> d=dict([[001,'mike'],[002,'mary']]) 
>>> d 

(1: 'mike', 2: 'mary'} 

>>> d=dict(zip((001,002),('mike','mary'))) 
>>> d 

(1: 'mike', 2: 'mary'} 

>>> d=dict(a='first',b='second') 

>>> d 

{'a': 'first', 'b': 'second'} 

>>> dict(one=1, two=2) 

{'two':2, 'one': 1} 


字典 访问 


(1) 访问 字典 中 元 素 值 
与 列表 和 元 组 不 同 ， 字 典 通过 键 值 而 非 索引 值 来 访问 字典 元 素 的 值 。 如 : 


>>> d={'mike':'1238569' 'mary':'1235345'} 
>>> d['mike'] 

'1238569' 

>>> d['mary'] 

'1235345' 


如 果 [] 中 的 键 值 并 不 存在 ， 则 会 报错 ， 如 : 


>>> d['john'] 


Traceback (most recent call last): 
File "<pyshell#36>", line 1, in <module> 
d['john'] 
KeyError: 'john' 


为 了 避免 这 种 错误 ， 可 以 先 使 用 字典 的 has_key0 方 法 或 in/not in 操作 符 来 检测 
否 存 在 该 键 。 如 : 


>>> d.has key('mike") 
True 

>>> d.has key('john') 
False 

>>> 'mike' ind 

True 

>>> 'John' in d 

False 


>>> 'john' not in d 


字典 中 是 
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True 


(2) 遍历 字典 
使 用 for 循环 可 查看 字典 中 所 有 的 键 - 值 对 ， 如 : 


>>> for key in d: 
print '%s=%s'%(key,d[key]) 


mike-1238569 
mary-1235345 

>>> ffonly print key 
>>> for key in d: 


print key=%s'% key 
key-mike 
key-mary 


在 for 循环 中 也 可 以 使 用 字 
烦 ， 所 以 不 建议 使 用 。 


的 keysO0 方 法 来 获取 字典 中 的 键 ， 但 比 仅 使 用 字典 名 麻 


>>>for key in d.keys(): 
print key=%s'% key 


key-mike 
key-mary 


在 for 循环 中 也 可 以 使 用 字典 的 values0 方 法 来 直接 获取 字典 中 的 键 所 对 应 的 值 ， 如 : 


>>> for value in d.values(): 


print 'value=%s'% value 


value-1238569 
value-1235345 


(3) 添加 字典 元 素 
为 字典 添加 新 的 元 素 的 格式 如 下 : 
字典 变量 名 [新 键 名 ]= 值 
如 : 
>>> d={'mike':'1238569''mary':'1235345'} 
>>> d 
{'mike': '1238569', 'mary': 1235345') 
>>> d[3ohn']-1534755' 
>>> d 
{mike': '1238569', 'john': 1534755', 'mary': '1235345'} 


(4) 修改 字典 元 素 
修改 字典 元 素 的 格式 与 添加 字典 元 素 的 格式 相似 ， 不 同 的 是 [] 中 为 字典 中 已 有 的 键 。 如 : 
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(6) 


C7) 


>>> d- ('mike': 1238569', ohn': 1534755', 'mary': '1235345'] 
>>> d['mary']-1346785' 

>>> d 

{'mike': '1238569', 'john': 1534755', 'mary': 1346785!) 


删除 字典 元 素 


>>> d- ('mike': 1238569', ohn': 1534755', 'mary': '1235345'] 
>>> d.pop(mary") 

'1346785' 

>>> d 

{'mike': 1238569', 50hn': '1534755'] 

>>> del d['mike'] 

>>> d 

{John': '1534755'} 


清空 字典 


i 


使 用 clear0 方 法 可 以 清空 字典 中 所 有 元 素 ， 如 : 


>>> d- ('mike': 1238569', 'john': '1534755', 'mary': '1235345'} 
>>> d 

{'mike': '1238569', john': '1534755', 'mary': 1235345" 

>>> d.clear() 


>>> d 


U 
删除 整个 字 : 


>>> d={'mike': 1238569', john': '1534755', 'mary': 1235345!) 
>>> del d 


删除 字典 对 象 d 后 ， 再 访问 时 就 会 出 错 ， 如 ; 


>>> d 


Traceback (most recent call last): 
File "<pyshell#74>", line 1, in <module> 
d 
NameError: name 'd' is not defined 


233 字典 相关 函数 


前 面 已 经 介绍 了 工厂 函数 dict0 用 来 创建 字典 ， 应 用 字典 编程 时 还 经 常会 用 至 
len0 和 hashO0， 分 别 用 来 求 字 典 元 素 的 数目 和 判断 某 对 象 是 否 可 用 作 字 典 的 键 。 


(1) 


Tar 


len() 


求 字 典 中 元 素 的 数目 ， 如 ; 


H del 或 字典 的 pop(0 方 法 来 删除 字典 元 素 。 删 除 字 典 元 素 时 ， 必 须 指定 要 删除 元 素 
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>>> d- ('mike': 1238569', ohn': 1534755', 'mary': '1235345'] 
>>> len(d) 
3 


(2) hash() 

Python 中 字典 的 键 要 求 是 可 hash 的 即 不 可 变 的 对 象 ， 在 Python 内 部 是 通过 字典 key 的 
hash 值 来 对 应 内 存 中 的 value 地 址 的 ， 可 以 使 用 hashO 函 数 判断 某 个 对 象 是 否 可 以 做 一 个 字 
典 的 键 。 如 果 对 和 象 是 可 hash 的 ， 函 数 返 回 值 是 整 型 ， 否 则 会 产生 错误 或 异常 。 

>>> hash(hai') 
1255409185 
>>> hash(78) 


78 
>>> hash([67,'89','ty']) 


Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
hash([67,'89','ty']) 
TypeError: unhashable type: 'list' 


(3) 字典 方法 


字典 提供 了 大 量 的 方法 ， 前 面 已 经 介绍 了 keys0 用 来 取 字 典 的 键 ，values0 用 来 取 字 — 典 的 
值 。 字 典 的 方法 详 见 表 2-7， 其 中 d- ('mike': '1238569', 'john': '1534755', 'mary': '1235345'}. 


表 2-7 字典 方法 


J dk TE 例 
>>> d.clear() 
dict.clear() 删除 字典 中 所 有 元 素 >>> d 
b 
>>> dl-d.copy() 
dict.copy() 浅 复制 字典 >> dl 
{'mike': 1238569', john': 1534755', 'mary': 1235345'] 
以 seq 中 各 值 做 字典 的 键 创 | 0070270 
建 并 返回 一 个 字典 ， de Xd >>> d2.fromkeys([12,3,4],num) 


dict.fromkeys(seq,val) 


ER Ep Ade {1: 'num', 2: 'num', 3: 'num', 4: 'num') 
对 应 的 初始 IH.» WRA HE val >>> d2.fromkeys([1,2,3,4,5]) 


则 默认 为 None (1: None, 2: None, 3: None, 4: None, 5: None} 


mes Ë >>> d.get('mike', 0000000") 
返回 字典 key 所 对 应 的 '1238569' 
value ， 如 果 字 典 中 不 存在 >>> d.get(henry',"0000000) 


dict.get(key,default) 


key， 则 返回 default, AUR AR 0000000! 
定 default， 默 认为 None >>> print d.get('henry") 


None 


查看 键 key 在 字典 中 是 否 存 | >>> dhas key(mike) 


; : 3 ` True 
车， 存在 由 il 
dicthas key(key) 在 ， 存 在 则 返回 True, luli >>> dhas key('henry) 
False False 
NY. pe >>>d.items() 
Jt. cp git bI oZ 
dict.items() 返回 字典 中 键 - 值 对 元 组 列表 [('mike', 1238569", (john', '1534755'), (mary', '1235345')] 
x lez orsi >>> d.keys() 
dict.keys() 返回 字典 中 键 的 列表 ['mike', 'john', 'mary"] 
dict.values() 返回 字典 中 值 的 列表 v dnd 


[1238569', 1534755', 12353457] 


( 续 ) 
o ”法 作 例 
dme. 与 dictitems(). dict. keys().  d.itervalues() 
duit pondus dictvalues0 方 法 相似 ， 不 同 的 <dictionary-valueiterator object at 0x0137E600> 
diere] 是 它们 返回 的 是 一 个 送 代 对 象 | >>> list(d itervalues0) 
j 而 不 是 列表 ['1238569', '1534755', 12353457] 
>>> d.pop('mike') 
"AS 1238569' 
如 果 字 典 中 存在 key, pup >>> d.pop('henry',no") 
除 key JH XJ ú # jË ik [n 'no' 
dict.pop(key,default) dict[key], 如 果 key 不 存在 ， 返 >>> dpop(henry) 
可 default 值 ， 如 果 未 指定 Traceback (most recent call last): 
default， 则 引发 KeyError 错误 File "<pyshell#30>", line 1, in <module> 
d.pop( henry?) 
KeyError: 'henry' 
7»2d.setdefault('henry',1452568") 
'1452568' 
>>> d 
如 果 字 典 中 存在 key, 5 {'mike': 1238569', 'john': '1534755', 'mary': '1235345', 'henry': 
: ous | 1452568) 
dic.setdefault(key,default) | get0 相 似 ， 如 果 不 存在 key, X >>> d.setdefault('mike'/789934938") 
加 key:default 元 素 '1238569' 
>>> d 
f'mike': '1238569', 'john': '1534755', 'mary': '1235345', 'henry': 
'1452568'} 
>>> d1={'001':'1382747''002':'1847838'} 
it dic. FREE >>> d.update(d1) 
dict.update(dict2) as m 的 元 素 添加 到 >>> d 
FI diet ('001': 1382747', '002': '1847838', 'mike': '1238569', 'henry': 
'1452568', 'john': 1534755', 'mary': 1235345] 
注意 : update0) 方 法 用 来 将 一 个 字典 的 元 素 添加 到 男 一 个 字典 中 ， 如 果 两 个 字典 中 有 相 


同 的 key， 则 源 字典 的 key dn 的 相应 key (828 iii, in. 


>>> d-Í'mike': 1238569', john': '1534755', 'mary': '1235345', 'henry': 1452568] 
>>> dl-('mike'1345673' 

>>> d.update(d1) 

>>> d 

{mike': '1345673', 'john': '1534755', 'mary': '1235345', 'henry': 1452568] 


下 面 用 字典 存储 电话 号 码 ， 并 查找 某 人 电话 (ch2-4.py)。 


#tel book example 

telbook- f'mike': '1238569', john': '1534755', 'mary': '1235345', 'henry': '1452568'} 
name-raw input("whose number do you want to get:") 

num-telbook.get(name) 

print name,"s number is", num 


运行 该 程序 ， 并 输入 mike, RU F: 


>>> 
whose number do you want to get:mike 
mike 's number is 1238569 
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24 高 级 话题 : NumPy 


现在 ， 科 学 家 、 研 究 者 、 工 程 师 经 常会 遇 到 数据 分 析 的 问题 ， 


通 


mi 


用 编程 语言 的 ， 在 科学 计算 方面 远 没 有 MATLAB, Maple 和 Mathematica 功能 强大 。 所 幸 


但 


Python 本 身 是 设计 为 


的 是 Python 的 支持 者 开发 了 NumPy, NumPy 使 Python 有 潜力 在 科学 计算 领域 与 MATLAB 
一 决 高 低 。 


NumPy (Numerical Python) 是 一 个 开源 的 Python 科学 计算 库 ， 
的 数组 。NumPy 包含 很 多 实 
等 功能 。 


Python 要 简洁 得 多 。NumPy 文 持 常见 的 数组 和 和 矩阵 操 


的 数学 函数 


代码 编写 工作 轻松 许多 。 


Numpy 已 经 包含 在 Anaconda 中 ， 如 使 月 


easy_install 或 者 pip 进行 安装 。 


2.4.1 NumPy 数组 与 Python 列表 的 区 别 


NumPy 使 用 ndarray 对 象 来 处 理 
2.2.2 r dr 


] 于 快速 处 理 任意 维度 


， 涵 盖 线 性 代数 运算 、 传 里 时 变换 和 随机 数 生 成 
NumPy 的 底层 代码 是 用 C 语言 写成 的 ， 其 对 数组 的 操作 速度 不 受 Python 解释 器 的 
限制 ， 效 率 远 优 于 纯 Python 代码 。 并 且 对 于 同样 的 数值 计算 任务 ， 使 


用 NumPy 比 直接 使 用 


现 多 维 数组 ， 那 么 为 什么 还 需要 使 用 NumPy 数组 呢 ? 


NumPy 专门 针对 数组 的 操作 条 


的 。 此 外 NumPy 是 专门 的 数组 语言 ， 用 划 
Python 列表 简单 得 多 。 
下 面 分 别 使 用 NumPy 数组 和 Python Z 


远 优 了 


的 取 值 为 0~99 的 平方 ， 向 量 e 为 向 量 a 和 


I 运算 进行 了 设计 ， 所 以 数组 的 存储 效率 和 输入 输出 ' 
F Python 中 的 嵌 套 列表 ， 数 组 越 大 ，NumPy 的 优势 就 越 明 显 。 通 常 NumPy 数组 中 的 所 
有 元 素 的 类 型 都 是 相同 的 ， 而 Python 列 
NumPy 数组 不 及 Python 列表 ， 但 在 科学 


表 中 的 元 素 类 型 是 任意 的 


操作 数组 ， 可 以 省 去 很 多 4 


的 和 。 


先 使 用 Python 列表 实现 (ch2-5-list.py): 
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#Python list 

import time 

tO0=time.clock() 

a=range(100) 

b=[] 

c-tl 

for i in range(100): 
b.append(a[1]**2) 
c.append(a[1]-b[i]) 

print c 

print time.clock()-t0 


E, FERRER 


日 标准 版 的 Python ， 可 通过 第 1 


数 ， 让 科学 计算 的 


Ev 


9 的 


多 维 数组 ， 该 对 象 是 一 个 快速 而 灵活 的 大 数据 容器 。 
了 Python 列表 ， 使 用 Python 列表 可 以 存储 一 维 数组 ， 通 过 列表 的 册 套 可 以 实 


Ka 


Lou 
tHE 


， 所 以 在 通用 性 方面 


计算 中 ， 通 常 需要 同时 处 理 的 数据 类 型 都 是 相同 


秆 环 语句 ， 代 码 比 使 用 


表 实 现 向 量 加 法 。 向 量 a 的 取 值 为 0~99， 向 量 b 


运行 结果 如 下 : 


2» 


[0, 2, 6, 12, 20, 30, 42, 56, 72, 90, 110, 132, 156, 182, 210, 240, 272, 306, 342, 380, 420, 462, 506, 552, 
600, 650, 702, 756, 812, 870, 930, 992, 1056, 1122, 1190, 1260, 1332, 1406, 1482, 1560, 1640, 1722, 1806, 1892, 
1980, 2070, 2162, 2256, 2352, 2450, 2550, 2652, 2756, 2862, 2970, 3080, 3192, 3306, 3422, 3540, 3660, 3782, 3906, 
4032, 4160, 4290, 4422, 4556, 4692, 4830, 4970, 5112, 5256, 5402, 5550, 5700, 5852, 6006, 6162, 6320, 6480, 6642, 
6806, 6972, 7140, 7310, 7482, 7656, 7832, 8010, 8190, 8372, 8556, 8742, 8930, 9120, 9312, 9506, 9702, 9900] 


0.0144567412315 


注意 : range(100) 的 作用 是 创建 一 个 有 100 个 元 素 的 列表 ， 取 值 分 别 为 0~99。 


使 用 NumPy 数组 实现 (ch2-5-numpy.py): 


# -*- coding: utf-8 -*- 
#NumPy array 


import time 


EL 


import numpy as np # 导 入 NumPy 模块 
t0—-time.clock() 


a-np.arange(100) 
b-np.arange(100)**2 
c-atb 

print c 


print time.clock()-t0 


运行 程序 ， 结 果 如 下 : 


[ 0 2 6 12 20 30 42 56 72 90 110 132 156 182 210 
240 272 306 342 380 420 462 506 552 600 650 702 756 812 870 
930 992 1056 1122 1190 1260 1332 1406 1482 1560 1640 1722 1806 1892 1980 

2070 2162 2256 2352 2450 2550 2652 27756 2862 29770 3080 3192 3306 3422 3540 
3660 3782 3906 4032 4160 4290 4422 4556 4692 4830 4970 5112 5256 5402 5550 
5700 5852 6006 6162 6320 6480 6642 6806 6972 7140 7310 7482 7656 7832 8010 


8190 8372 8556 8742 8930 9120 9312 9506 9702 9900] 
0.00175865173318 


比较 两 个 程序 ， 显 然 使 用 NumPy 数组 的 代码 更 简洁 。 运 行 两 个 程序 ， 会 发 现 NumPy 


代码 (用 时 0.0018s) [KE Python 代码 (用 时 0.014s) 运行 速度 快 ， 


并 且 向 量 越 大 ， 速 度 差异 


越 明 显 。 两 种 方法 得 到 的 结果 数值 是 一 样 的 ， 但 是 输出 方式 有 所 不 同 ， 使 用 Python 列表 
时 ， 和 输出 的 数值 间 用 逗号 分 隔 ， 而 使 用 NumPy 数组 时 则 没有 逗号 。 


2.4.2 NumPy 数据 类 型 


Python 支持 的 整 型 、 浮 点 型 和 复数 型 数据 不 能 满足 科学 计 售 


的 需求 ，NumPy 可 以 在 数 


据 类 型 的 后 面 加 上 数字 ， 标 识 这 种 类 型 在 内 存 中 占 的 位 数 ， 这 相当 于 提供 了 更 多 种 数据 类 


型 。 表 2-8 列 出 了 NumPy 中 支持 的 数据 类 型 。 
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2-8 NumPy 支持 的 数据 类 型 


名 称 Hi x 
bool 个 bit 存储 的 布尔 类 型 (True 或 False? 
inti 所 在 平台 决定 其 所 占 位 数 的 整数 一 般 为 int32 或 int64) 
int8 一 个 字 节 大 小 ，-128~127 
int16 整数 ，-32768~32767 
int32 整数 ，-231~231-1 
int64 Xe, 2929.1 
uint8 无 符号 整数 ，0~255 
uint16 无 符号 整数 ，0~65535 
uint32 无 符号 整数 ，0~232-1 
uint64 无 符号 整数 ，0~2%-1 
float16 半 精 度 浮 点 数 : 16 位 ， 正 负 号 1 位 ， 指 数 5 位 ， 尾 数 10 位 
float32 单 精度 浮 点 数 ，32 位 ， 正 负 号 1 位， 指数 8 位 ， 尾 数 23 位 
float64 或 float 双 精 度 浮 点 数 : 64 位 ， 正 负 号 1 位， 指数 11 位 ， 尾 数 52 位 
complex64 复数 ， 分 别 用 两 个 32 位 浮 点 数 表示 实 部 和 虚 部 
complex128 或 complex 复数 ， 分 别 用 两 个 64 位 浮 点 数 表 示 实 部 和 虚 部 


在 NumPy 中 可 以 使 用 类 型 转换 函数 (与 类 型 名 称 相同 〉 将 数字 转换 为 相应 类 型 ， 


>>> import numpy 
>>> numpy.bool(6) 
True 
>>> numpy.bool(0) 
False 


>>>numpy.int8(True) 

1 

>>> numpy.int16(True) 

1 

>>> numpy.int32(True) 

1 

>>> numpy.int64(True) 

1 

>>> numpy.uint8(-122) 
134 

>>> numpy.uint16(-122) 
65414 

>>> numpy.int32(True) 

1 

>>> numpy.uint64(-122) 
18446744073709551494 
>>> numpy.float64(-122) 
-122.0 

>>> numpy.float32(-122) 
-122.0 
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>>> numpy.complex64(64) 
(64+0j) 

>>> numpy.complex(64) 
(64+0j) 


在 NumPy 中 ， 多 数 函 数 允 许 使 用 指定 数据 类 型 的 参数 ， 通 
格式 为 dtype= 类 型 名 ， 例 如 : 


>>> a= 


>a 


numpy.arange(5,dtype=int) 


array([0, 1, 2, 3, 4]) 


>>> a= 


>a 


array([ 


>>> a= 


>a 


array([ 


numpy.arange(5,dtype=float) 


05 15-25-35. AN 
numpy.arange(5,dtype-complex) 


0.+0j， 140j, 2.40j, 3.+0.j, 430j] 


NumPy 中 也 可 以 使 用 dtype 函数 根据 标准 数据 类 型 自 定义 数 


的 多 项 数据 。 


>>>st=: 


numpy.dtype([('code',str,10),('name',str,10),('price',float)]) 


例如 ， 使 


j NumPy 自 定义 数据 类 型 处 理 股票 信息 (ch2-6.py): 


# -*- coding: utf-8 -*- 
import numpy 


st-numpy.dtype([('code';str, 10), ('name';unicode,20),('price'float)]) 
a-numpy.array([('000001',u'^[^ 72*,15),(000002';u JJ I, 13.6)],dtype-st) 
msg = repr(a).decode('unicode-escape") 


print msg 


运行 结果 如 下 : 


array([(000001', u' 平 安 , 15.0), (000002', u JIE}, 13.6)], 


25 小结 


dtype-[('code', 'S 10"), (‘name', '«U20^, ('price', '<f8")]) 


本 章 主 要 i 


各 种 类 型 的 特点 、 应 用 以 及 支持 的 运算 符 和 函数 。 在 灵活 使 用 Python 编写 程序 之 前 ， 掌 握 
这 些 数 据 类 型 的 特点 ， 并 灵活 运用 它们 是 必要 的 。 在 本 章 的 最 后 
学 计算 和 数据 分 析 基 而 


述 Python 的 基础 知识 ， 包 括 Python 的 数字 类 型 


常 这 个 参数 是 可 选 的， 指定 


据 类 型 ， 以 便 存储 不 同 对 象 


、 序 列 类 型 和 字典 ， 介 绍 了 


介绍 了 Python 的 高 性 能 科 


HE NumPy， 包 括 NumPy 的 数组 、 数 据 类 型 和 基本 操作 。 由 于 Numpy 


是 Python 科学 计算 的 基础 ， 在 第 3 章 还 要 对 Numpy 的 有 关 数组 操作 做 进一步 延伸 ， 如 果 读 
者 需要 更 多 的 Numpy 知识 ， 还 可 参考 Numpy 的 文档 。 
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35 控制 流程 与 运算 


Python 的 选择 结构 和 循环 结构 与 C 语言 类 似 ， 使 用 站 来 实现 选择 ， 使 用 while 和 for 来 
实现 循环 。 本 章 会 深入 介绍 Python 的 控制 流程 及 其 相关 内 容 。 


3.1 选择 结构 


在 Python 中 使 用 if 语句 可 以 实现 单 分 支 结构 ， 即 如 果 条 件 成 立 则 执行 条 件 后 面 的 代码 
Busty, fir if 代码 块 后 的 代码 。 使 用 ifrelse 语句 可 以 实现 双 分 支 结构 ， 条 件 成 立 则 
执行 if 后 语句 ， 否 则 执行 else 后 语句 ，iftelifrelse 可 以 实现 多 分 支 结构 ， 依 次 判断 各 个 条 
件 ， 某 条 件 成 立即 执行 其 后 语句 ， 所 有 条 件 都 不 成 立 则 执行 else 后 面 的 语句 。 


3.1.4. 单 分 支 结 构 
当 某 个 条 件 成 立时 ， 才 需要 完成 某 些 操作 ， 这 时 可 编写 单 分 文 结 构 。 

让 语句 的 使 用 格式 如 下 : 

if KAR: 

代码 块 

如 果 表 达 式 的 结果 为 布尔 真 或 非 零 ， 则 执行 代码 块 ， 否 则 不 执行 。 

在 Python 中 ， 代 码 是 否 属于 让 语句 的 代码 块 ， 是 通过 缩 进来 确定 的 ， 而 不 是 像 C 语言 
HORE. 

下 面 编程 检测 用 户 是 否 正 确 输入 了 用 户 名 ( 源 代码 为 ch3-1.py)。 

分 析 : 使 用 列表 保存 正确 的 用 户 名 ， 然 后 在 列表 中 查找 用 户 输 入 的 名 字 ， 如 果 用 户 名 存 
在 于 列表 中 ， 则 显示 欢迎 该 用 户 的 信息 。 


# -*- coding: utf-8 -*- 
a-['mike',mary','ohn','tom','jenny';'herry'] 
b-raw input('please input your name: ) 
if (b in a): 

print "欢迎 ,b 


运行 程序 ， 输 入 mary， 运 行 结果 如 下 : 


please input your name: mary 
欢迎 mary 
if 语句 中 ， 如 果 条 件 成 立时 只 需要 执行 一 条 代码 ， 则 这 条 代码 可 以 与 “if 条 件 表达 
式 : ” 写 在 同一 行 上 ， 如 : 


if (b in a): print u 欢 迎 ,b 


代码 中 的 print. 语句 也 可 以 写成 两 行 ， 因 为 条 件 成 立时 才 需 要 输出 “欢迎 ”和 姓名 ， 记 
以 两 个 print 语句 有 相同 的 缩 进 ， 表 示 其 都 为 条 件 成 立时 需 执 行 的 代码 。 


if (b in a): 
printu 欢 迎 ', 
print b 


初学 Python 的 读者 一 定 要 注意 证 语句 的 表达 式 后 要 加 冒号 CO. 

if 后 的 表达 式 可 以 是 简单 的 关系 表达 式 ， 也 可 以 是 复杂 的 逻辑 表达 式 。Python 中 使 用 操 
作 符 and, or. not 来 实现 逻辑 与 、 或 、 非 的 操作 。 

修改 ch3-1.py 文件 ， 检 测 用 户 是 否 正确 输入 用 户 名 和 密码 (ch3-2.py)。 

分 析 : 因为 既 要 保存 用 户 姓名 还 要 保存 其 密码 ， 所 以 选择 用 字典 来 存储 相关 信息 ， 然 后 
在 字典 的 键 中 查找 用 户 输入 的 用 户 名 ， 并 将 输入 的 密码 与 键 对 应 的 值 比 较 ， 以 判断 是 否 为 正 
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# -*- coding: utf-8 -*- 
a-dict((['mike','001'],['mary','002"].['5ohn',003'],['tom','004'], ['jenny','005'],['herry','006'])) 
b-raw input('please input your name: ') 
c-raw input('please input your password: ') 
if (b in a) and c—-a[b]: 
print u 欢 迎 ,b 


运行 程序 ， 依 次 输入 mary，002， 运 行 结 果 如 下 : 


please input your name: mary 
please input your password: mary 
欢迎 mary 


3.1.2” 双 分 支 结 构 
若 条 件 成 立时 需要 执行 某 些 操作 ， 不 成 立时 需要 执行 另外 一 些 操作 ， 则 需要 编写 双 分 支 
结构 。 让 语句 与 else 语句 结合 可 实现 双 分 支 结 构 。 
双 分 支 结构 的 使 用 格式 如 下 : 
if 表达 式 : 
代码 块 1 


else: 
代码 块 2 
首先 判断 if 后 的 表达 式 ， 如 果 表 达 式 结果 为 布尔 真 或 非 零 ， 则 执行 代码 块 1， 否 则 执行 
代码 块 >。 初学 者 需要 注意 “if 表达 式 ” 和 “else” 后 都 要 加 冒号 C 
下 面 编程 修改 ch3-2.py 文件 。 如 果 用 户 正确 输入 用 户 名 和 密码 ， 则 欢迎 用 户 ， 否 则 提示 
用 户 输 入 正确 的 用 户 名 和 密码 (ch3-3.py)。 下 面 通过 添加 else 语句 完成 双 分 支 结 构 实 现 。 
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-*- coding: utf-8 -*- 
a-dict((['mike','001'],['mary',002"],['john',003'],['tom',004"], ['jenny', 005"],['herry',006'])) 
b-raw input('please input your name: ') 
c-raw input('please input your password: ') 
if (b in a) and c--a[b]: 
print wu 欢迎 ,b 
else: 


print uw' 请 输入 正确 的 用 户 名 和 密码 ' 


运行 程序 ， 依 次 输入 mary，002， 运 行 结果 如 下 : 


please input your name: mary 
please input your password: 002 
欢迎 mary 


运行 程序 ， 依 次 输入 mary，001， 运 行 结果 如 下 : 


please input your name: mary 


please input your password: 001 
请 输入 正确 的 用 户 名 和 密码 
在 使 用 ifrelse 结构 时 ， 一 定 要 注意 ，Python 是 利用 缩 进来 决定 代码 是 属于 站 的 代码 块 1 
还 是 else 的 代码 块 2， 要 正确 地 缩 进 代码 ， 和 否则 会 引发 错误 或 导致 错误 结果 。 
如 果 ch3-3.py 中 的 站 结构 写成 如 下 形式 ， 则 会 引发 错误 。 


if (b in a) and c—a[b]: 
print u' 欢 迎 ，， 


print b 
else: 


print u' 请 输入 正确 的 用 户 名 和 密码 
引发 错误 提示 如 图 371 所 示 。 


Syntax error 


There's an error in your program: 


invalid syntax 


图 3-1 错误 缩 进 导 致 的 语法 错误 
原因 是 print b 没有 正确 缩 进 ， 所 以 Python 认为 让 语句 到 print u 欢 迎 ' 即 结束 ， 后 面 没 
有 配对 的 else， 当 后 面 再 出 现 else 时 就 没有 配对 的 证 了， 因此 引发 错误 。 
3.1.3 ”多 分 支 结核 


当 需 要 根据 多 个 条 件 进行 判断 ， 满 足 不 同 条 件 执 行 不 同 代码 块 时 ， 需 要 编写 多 分 支 结 
Kj. Python 中 站 语句 与 el 站 语句 和 else 语句 结合 可 实现 多 分 支 结构 。 
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多 分 支 结构 的 使 用 格式 如 下 : 


if 表达 式 1: 

代码 块 1 

elif 表达 式 2: 
代码 块 2 


elif 表达 式 n: 
代码 块 n 
else: 


代码 块 n+1l 


程序 执行 时 ， 由 上 至 下 依次 判断 表达 式 是 否 为 真 ， 如 果 为 真 则 执行 其 后 的 代码 块 ， 整 个 


多 分 支 结构 结束 ， 否 则 继续 向 下 判断 ， 当 所 有 表达 式 结果 都 为 假 时 ， 执 行 else 后 的 语句 块 。 


的 


El 


Pn 


下 面 修改 ch3-3.py 文件 。 如 果 用 户 正 确 输 入 管理 员 级 的 用 户 名 和 密码 则 欢迎 管理 员 用 
户 ， 如 果 用 户 正确 输入 普通 用 户 级 的 用 户 名 和 密码 则 欢迎 普通 用 户 ， 否 则 提示 用 户 输入 正确 
] 户 名 和 密码 ( 源 代码 : ch3-4.py)。 


分 析 : 相 比 ch3-3.py， 本 例 需要 两 个 字典 ， 一 个 存储 管理 员 信 息 ， 一 个 存储 普通 用 户 信 


用 户 输入 用 户 名 和 密码 后 先 判 断 其 是 不 是 


里 员 用 户 ， 再 判断 其 是 不 是 普通 用 户 ， 如 果 


1R 


都 不 是 则 提示 用 户 输入 正确 的 用 户 名 和 密码 。 


# -*- coding: utf-8 -*- 
a-dict((['admin1', 123'],['admin2',456'],['admin3',789'])) 
u-dict((['mike',001'],['mary','002'],['john',003'], ['tom','004'], ['jenny', 005", ['herry','006'])) 
b-raw input('please input your name: ') 
c-raw input('please input your password: ') 
if (b in a) and c—-a[b]: 
printu 欢 迎 管理 员 "ib 
elif (b in u) and c==u[b]: 
print u 欢 迎 用 户 b 


else: 


print uw' 请 输入 正确 的 用 户 名 和 密码 ' 


运行 程序 ， 依 次 输入 admin1，123， 运 行 结果 如 下 : 


please input your name: adminl 
please input your password: 123 
欢迎 管理 员  adminl 


运行 程序 ， 依 次 输入 mary，002， 运 行 结 果 如 下 : 


please input your name: mary 
please input your password: 002 
IGUH mary 
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运行 程序 ， 依 次 输入 jon，003， 运 行 结果 如 下 : 


please input your name: jon 
please input your password: 003 
请 输入 正确 的 用 户 名 和 密码 


3.1.4 ”条 件 表达 式 
使 用 过 C/C++ 语言 的 程序 员 ， 都 会 对 条 件 运 算 符 记忆 犹 新 ， 条 件 运 算 符 使 执行 赋值 的 双 
分 支 结构 变 得 简洁 易 行 。Python 中 一 开始 并 没有 对 应 的 条 件 表达 式 ， 在 Python 2.5 及 以 后 版 
本 中 ， 提 供 了 类 似 的 条 件 表达 式 : 

表达 式 1 if 条 件 表达 式 else 表达 式 2 
因此 ， 对 于 以 下 的 代码 : 


>>> x=5 

>>> y=7 

>>> 1f x>6: 
Z 一 X 


else: 


在 Python 2.5 及 以 后 版 本 中 就 可 以 使 用 条 件 表达 式 ， 用 一 名 语句 代替 其 中 的 ifrelse 双 分 
x EM. 


>>> z-x if x26 else y 


>>> z 
7 


3.2 ”循环 结构 


Python 中 可 以 使 用 while 语句 和 for 语句 来 实现 循环 ， 其 中 while 语句 与 多 数 语言 中 的 
while 语句 类 似 ， 而 for 语句 则 相对 变化 较 大 。 


3.2.1 while i£) 
while 语句 是 条 件 循环 语句 ， 满 足 条 件 则 执行 循环 体 ， 否 则 循环 结束 。 
while 语句 的 使 用 格式 如 下 : 
while 表达 式 : 
循环 体 (代码 块 ) 
在 Python 中 哪些 语句 属于 循环 体 也 是 通过 缩 进 而 非 界定 符 来 确定 的 。 
下 面 编程 计算 1+2+3+…+100 (ch3-5.py)。 要 计算 100 个 数 的 和 ， 需 要 反复 进行 加 法 运 


算 ， 通 过 循环 来 完成 反复 执行 的 操作 。 
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n-l 
s-0 
while n«101: 
s-stn 
n=n+1 
print '1+2+3+. ..+100=',s 


运行 程序 ， 运 行 结 果 如 下 : 


1+2+3+...+100= 5050 


在 使 用 while 语句 时 ， 要 注意 循环 体 中 要 有 改变 循环 条 件 的 代码 ， 以 免 程序 陷入 死 循 
环 ， 当 然 有 的 时 候 需 要 特意 编写 死 循环 ， 以 便 程序 能 够 持续 执行 ， 如 许多 通信 系统 的 服务 器 
就 是 通过 和 死 循 环 来 提供 不 间断 的 服务 的 。 

1. while 语句 +else 语句 

在 Python 中 while 语句 也 可 以 与 else 语句 搭配 ， 使 用 格式 如 下 : 

while 表达 式 : 
循环 体 〈 代 码 块 1) 


else: 


代码 块 2 


如 果 表 达 式 为 真 则 执行 循环 体 〈 语 句 块 )， 表 达 式 为 假 时 执行 一 次 else 后 的 代码 块 2。 
这 种 结构 使 得 循环 结束 时 可 以 完成 某 些 操作 。 
修改 ch3-3.py， 给 用 户 3 次 输入 正确 用 户 名 和 密码 的 机 会 (ch3-6.py)。 如 果 输 入 错误 需 
要 重复 输入 ， 所 以 选择 使 用 while 循环 ， 如 果 输 入 错误 量 输 入 次 数 不 超 过 3 次 则 可 以 重新 


# -*- coding: utf-8 -*- 
a-dict((['mike'/001'],['mary',002"],['john',003'] ['tom';004'],['jenny','005'] 'herry','006'])) 
print u' 请 输入 正确 的 用 户 名 和 密码 ,你 有 3 次 输入 机 会 ' 


b=raw_input('please input your name: ') 


c-raw input('please input your password: ') 
n-l 
while (b not in a) or c!-a[b]: 
n=n+1 
if n>3: 
print'3 次 输入 错误 ， 程 序 结束 ' 
break 
print u' 你 还 有 ',4-n,' 次 输入 机 会 ,请 输入 正确 的 用 户 名 和 密码 ' 


b-raw input('please input your name: ') 


c-raw input('please input your password: ') 
else: 
printu 欢 迎 "b 


运行 程序 ， 依 次 输入 mary 和 002， 运 行 结果 如 下 : 
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请 输入 正确 的 用 户 名 和 密码 ,你 有 3 次 输入 机 会 


please input your name: mary 


please input your password: 002 
欢迎 mary 


运行 程序 ， 依 次 输入 m，01; j, 02; u，03， 运 行 结果 如 下 : 


请 输入 正确 的 用 户 名 和 密码 ,你 有 3 次 输入 机 会 


please input your name: m 


please input your password: 01 
你 还 有 2 次 输入 机 会 ,请 输入 正确 的 用 户 名 和 密码 


please input your name: j 


please input your password: 02 
你 还 有 1 次 输入 机 会 ,请 输入 正确 的 用 户 名 和 密码 


please input your name: u 


please input your password: 03 
3 次 输入 错误 ， 程 序 结束 
如 果 是 因为 不 满足 while 后 的 条 件 而 退出 循环 的 ， 就 会 执行 else 后 的 语句 ， 即 输出 “ 欢 
迎 ****” 如 果 是 过 到 break 而 跳出 循环 的 ， 则 不 会 执行 else 语句 。 
2. break 语句 
Python 中 的 break 语句 与 多 数 语言 的 break 语句 类 似 。break 语句 用 在 循环 ， 于 跳出 
循环 。break 经 常 与 if 语句 结合 使 用 ， 用 站 语句 判断 是 否 满足 跳出 循环 的 条 件 ， 如 果 满 足 条 
件 ， 则 使 用 break 跳出 循环 。 在 Python 中 ， 既 可 以 使 用 break 语句 跳出 while 循环 ， 也 可 以 
使 用 break 语句 跳出 for 循环 。 
如 果 在 循环 中 遇 到 break 语句 ， 则 整个 循环 结束 ， 不 执行 循环 后 面 的 else 部 分 。else fh 
环 子 句 只 有 在 循环 正常 完成 后 方 会 执行 ， 也 就 是 说 break 语句 也 会 跳 过 else 语句 。 
下 面 编程 求 一 个 数 的 最 大 真 因数 (ch3-7.py)， 本 例 反复 用 数 n 对 小 于 或 等 于 n2 的 数 求 
余 ， 如 果 余 数 为 0， 则 找到 最 大 真 因数 ， 使 用 break 语句 退出 循环 。 


# -*- coding: utf-8 -*- 
n-input('please input the number: ') 
m-n/2 # 因为 一 个 数 的 最 大 真 因数 不 可 能 大 于 大 
while m>0: 
if n % m==0: 
print nu 的 最 大 真 因数 为 ,m 
break 


的 一 半 ， 所 以 初 值 设 为 m2 


— 
I 


m-m-1 


运行 程序 ， 输 入 9， 运行 结果 为 : 


please input the number: 9 
9 的 最 大 真 因数 为 3 


3. continue 语句 
Python 中 的 continue 语句 与 多 数 语言 的 continue 语句 也 类 似 。Python rH continue 语句 用 
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T while 循环 或 for 循环 ， 作 用 是 结束 本 次 循环 ， 然 后 判断 循环 条 件 或 验证 是 否 还 有 元 素 可 
迄 代 ， 决 定 是 否 开 始 下 一 次 循环 。 

例如 求 1-100 中 能 同时 被 3 和 7 整除 的 数 的 个 数 (ch3-8.py)。 代 码 中 1~100 每 个 数 依次 
判断 是 否 能 同时 被 3 和 7 整除 ， 如 果 能 ， 则 加 1， 否则 判断 下 一 个 数 。 


# -*- coding: utf-8 -*- 
n=0 
m=0 
while m<=100: 

m=m+1 

if m 96 3!=0 or m % 71—0: 

continue 

n=n+1 

print u'1-100 中 有 ',n,u' 个 数 能 被 3 和 7 整除 ' 


运行 程序 ， 运 行 结果 为 : 


1-100 中 有 4 个 数 能 被 3 和 7 同时 整除 
3.22 for 语句 


Python 中 的 for 语句 与 其 他 语言 区 别 较 大 ， 更 像 其 他 语言 的 foreach 循环 ， 为 Python 提 
供 了 强大 的 循环 结构 ， 可 以 遍历 序列 成 员 ， 可 以 用 在 列表 解析 和 生成 器 表达 式 中 。for 语句 
能 够 在 后 人 台 自 动 调用 迭代 器 的 next 方法 ， 捕 获 Stoplteration 异常 并 结束 循环 。 
for 语句 的 使 用 格式 : 
for EREE in 8402: 
循环 体 
迭代 对 象 可 以 是 序列 、 和 迭代 器 或 其 他 支持 欠 代 的 对 象 。 每 次 循环 时 ， 友 代 变量 表示 可 
友 代 对 象 的 当前 元 素 ， 一 次 循环 结束 ， 再 表示 友 代 对 象 的 下 一 个 元 素 ， 直 至 所 有 元 素 迭 代 
完毕 。 
下 面 编程 输出 “我 是 歌手 ”节目 第 三 季 第 一 场 中 出 场 歌 手 的 次 序 和 姓名 〈ch3-9.py)。 歌 
手 姓 名 按照 出 场次 序 保 存在 元 组 中 ， 利 用 for 循环 依次 输出 。 
# -*- coding: utf-8 -*- 


namelist-[u' tr E:JE'u f] ju PCHIE Au 58 EXC Su! C su TIE Blai ub £T] 
n=l 


for sn in namelist: 
Eris 


print u' 第 ',n,u' 位 出 场 歌 手 : ,sn 


n=n+] 
运行 程序 ， 运 行 结果 如 下 : 
第 1 位 出 场 歌手 : 古巨基 
第 2 位 出 场 歌手 : 孙楠 
第 3 位 出 场 歌 手 : 黄 丽 玲 


65 


Python FP 4 PP Jf] 


第 4 位 出 场 歌手 : STER 
第 5 位 出 场 歌手 : 陈 洁 仪 
第 6 位 出 场 歌手 : ”张靓颖 
第 7 位 出 场 歌 手 : 韩 红 


1. enumerate 函数 
在 ch3-9.py 中 ， 借 助 了 变量 n 来 显示 歌手 的 出 场次 序 ， 其 实 自 Python 2.3 Ji, Python 就 新 
增加 了 enumerate 函数 ， 不 仅 可 以 访问 可 迭代 对 象 的 元 素 ， 还 可 以 访问 其 索引 MEFR). 
下 面 用 enumerate 函数 改写 ch3-9.py 代码 (ch3-10.py)。 程 序 直 接 利 用 enumerate 函数 
的 返回 值 获得 歌手 出 场次 序 及 姓名 。 
# -*- coding: utf-8 -*- 
namelist-[u' tr E:JE'u Pi ju 9 CHI A uw 58 EXC Su! B C su TI Blai ub £T] 
for n,sn in enumerate(namelist): 
printu 第 %d Hx :%s'%(n+1,sn) 


运行 程序 ， 运 行 结果 如 下 : 
第 1 位 出 场 歌手 :古巨基 
第 2 位 出 场 歌 手 :孙楠 
第 3 位 出 场 歌手 : 黄 丽 玲 
第 4 MEDRE WJ Pe WQ 
第 5 位 出 场 歌手 : 陈 洁 仪 
第 6 位 出 场 歌手 :张靓颖 
第 7 MEAR 


2. range 函数 

在 Python 中 for 语句 与 range 函数 搭配 可 以 实现 其 他 语言 中 for 循环 的 功能 。 在 本 书 前 
面 章 节 中 也 用 到 过 range 函数 ， 本 小 节 将 对 range 函数 做 详细 介绍 。 

range 函数 的 使 用 格式 : 

range( 初 值 , 终 值 , 步 长 ) 

range 函数 会 返回 一 个 包含 “( 终 值 - 初 值 ) / 步 长 ”个 元 素 的 有 序列 表 ， 各 元 素 的 值 大 于 
或 等 于 初 值 且 小 于 终 值 ，range 函数 的 三 个 参数 〈 初 值 , 终 值 , 步 长 ) 都 要 求 是 整 型 数字 ， 步 长 
省 略 则 默认 为 1， 初 值 省 略 则 默认 为 0， 如 : 


>>> range(4) 

[0, 1, 2, 3] 

>>> range(2,7) 
[2, 3, 4, 5, 6] 
>>> range(2,7,3) 
[2.5] 


注意 : 元 素 值 必 须 小 于 终 值 。 步 长 不 可 以 为 0， 否则 会 引发 错误 ， 如 : 


>>> range(2,7,0) 


Traceback (most recent call last): 
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File "<pyshell#12>", line 1, in «module 
range(2,7,0) 
ValueError: range() step argument must not be zero 
例如 ， 下 面 的 程序 利用 for 语句 和 range 函数 计算 1+2+3+…+100(ch3-11.py)。 为 了 
range 中 的 元 素 能 取 到 100, range 的 终 值 参数 应 该 设 为 101。 


s-0 
for n in range(1,101): 


s-stn 
print '1+2+3+...+100=',s 


运行 程序 ， 运 行 结果 为 : 
1+2+3+...+100= 5050 

本 例 中 虽然 代码 很 简洁 ， 但 是 range(1,101) 要 产生 100 个 元 素 的 列表 ， 占 有 较 多 的 内 
存 ， 如 果 需 要 处 理 更 大 范围 列表 时 ，range 函数 的 缺点 显而易见 。 为 此 Python 提供 了 xrange 

3. xrange 函数 

xrange 函数 与 range 函数 类 似 ， 但 不 会 在 内 存 中 创建 列表 的 完整 副本 。 它 只 能 用 于 for 
循环 中 ， 在 for 循环 外 ，xrange 函数 毫 无 意义 。 

xrange 函数 的 调用 格式 与 range 函数 相同 。 

xrange( 初 值 , 终 值 , 步 长 ) 
如 : 


>>> for i in xrange(3,9): 


print i, 


345678 
>>> foriin xrange(3): 


print i, 


012 
>>> for i in xrange(3,9,2): 
print i, 
357 
4. 和 迭代 器 
for 循环 不 仅 可 以 遍历 序列 ， 也 可 以 访问 迭代 器 。 用 for 循环 访问 迭代 器 与 访问 序列 的 方 
法 差不多 。 失 代 器 对 象 都 有 一 个 next 方法 ， 调 用 后 会 返回 下 一 个 条 目 。 所 有 条 目 迭 代 完 后 ， 
迭代 器 会 引发 Stoplteration 异常 告诉 程序 循环 结束 。for 语句 会 自动 (不 需要 程序 员 处 理 ) 调 
HERA next 方法 ， 捕 获 Stoplteration 异常 并 结束 循环 。 当 用 for 语句 循环 迭代 一 个 对 象 
条 上 日 时 ， 不 需要 区 分 对 象 是 迭代 器 还 是 序列 ， 因 为 for 语句 操作 序列 和 迭代 器 在 前 台 是 没有 
区 别 的 。 
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(1) 创建 迁 代 器 
Python 的 内 建 函 数 iter 可 以 返回 一 个 迁 代 器 对 象 。iter 函数 有 两 种 使 用 格式 ， 分 别 为 ; 


iter(collection) 


要 求 参数 collection 必须 是 序列 或 者 是 实现 了 _iter (0 方法 和 next0 方 法 的 类 。 


iter(callable,sentinel) 


这 种 形式 中 callable 会 不 断 被 调用 ， 直 至 遇 到 sentinel. 


(2) 序列 迭代 器 
对 序列 调用 iter 函数 即 返回 序列 迭代 器 ， 如 : 


>>> yz=['string','list','tuple','dict'] 
>>> iyz=iter(yz) 

>>> iyz.next() 

'string' 

>>> for u in iyz: 


print u 


list 
tuple 
dict 
En] PLA SR RETE mU. AIRES, WAEREA, USE ELI 3T 
de. dE EplrpeesrxsfOss iyz 后 ， 调 用 了 一 次 next 方法 ， 回 头 再 用 for IRER iyz 时 ， 是 
从 第 2 项 list 开始 的 。 

(3) 字典 迭代 器 

字典 可 以 通过 键 〈iterkeys0)、 值 Citervalues)) 或 者 键 - 值 (iteritems()〉 对 来 迭代 。 在 

只 给 出 字典 名 的 情况 下 ，for 循环 会 遍历 字典 的 键 ， 即 : 


for 循环 变量 in 字典 名 


for 循环 变量 in 字典 名 .keys0 


下 面 编程 显示 电话 短 中 所 有 信息 (ch3-12.py)。 


分 析 : 利用 字典 来 存储 电话 短 ， 利 用 for 语句 裔 历 输出 电话 短信 息 。 


# -*- coding: utf-8 -*- 
teldict- ('mary':1362456737' 50hn':13609822567'/tom':15920488245'| 
for name in teldict: 

print name,':',teldict[name] 


运行 程序 ， 运 行 结果 如 下 : 


john : 13609822567 
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mary : 1362456737 
tom : 15920488245 


使 用 iterkeys0 方 法 改写 程序 ， 代 人 码 如 下 (ch3-12-1.py): 


-*- coding: utf-8 -*- 
teldict- ('mary':1362456737',50hn':13609822567';tom': 15920488245" 
for name in teldict.iterkeys(): 


print name,':',teldict[name] 


使 用 iteritems0 方 法 改写 程序 ， 代 人 码 如 下 (ch3-12-2.py): 


# -*- coding: utf-8 -*- 
teldict- ('mary':1362456737',50hn':13609822567';tom': 15920488245" 
for (name,tel) in teldict.iteritems(): 


print name, tel 


在 Python 3.x 中 ， 字 典 对 象 不 再 支持 iterkeys(). itervaluesO4l iteritems()， 取 而 代 之 的 是 
keyO、values0 和 item()。 
(4) 文件 迭代 器 
文件 对 象 生成 的 迭代 器 会 自动 调用 readlineQ77 3A, El: 
for 循环 变量 in 文件 迭代 器 
等 价 于 
for 循环 变量 in 文件 迭代 器 .readline() 


下 面 读 出 并 显示 文本 文件 中 的 所 有 内 容 (ch3-13.py) 
分 析 : 打开 文件 后 ， 用 for 语句 遍历 文件 每 一 行 并 输出 。 


` 


# -*- coding: utf-8 -*- 
ifile=open('ch3_13.txt','r') 
for eline in ifile: 
print eline，“# 因 为 读 出 的 每 行 信息 中 含有 换行 符 ， 所 以 这 里 加 逗号 防止 重复 换行 


文件 ch3_13.txt 中 的 内 容 如 图 3-2 所 示 。 


| ch3_13.txt - 记事 本 cg) X 
文件 (F) ”编辑 (E) fi&xt(O) SEV) MH) 
Python 


Hello world 
iterator 


图 3-2 文本 文件 中 的 内 容 


7i 


运行 程序 ， 输 出 结果 如 下 : 


Python 
Hello world 


iterator 
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5. 列表 解析 
for 语句 也 可 以 用 于 列表 解析 中 。 列 表 解 析 是 一 个 非常 简洁 高 效 的 工具 ， 可 以 动态 地 创 
建 列表 。 列 表 解 析 的 使 用 格式 如 下 : 


[表达 式 for 循环 变量 in 可 人 迭代 对 象 ] 
例 : 


>>> [pow(a,3) for ain range(3,10)] 
[27, 64, 125, 216, 343, 512, 729] 


如 ， 提 取 号 码 短 中 所 有 电话 号 码 ; 


2»»teldict- ('mary':1362456737''john':13609822567',tom':15920488245'] 
>>> [teldict[name] for name in teldict] 
[13609822567', 1362456737, 15920488245'] 


表达 式 中 也 可 以 不 使 用 循环 变量 ， 如 : 


>>> b=10 
>>> [b+2 forainrange(3,10)] 
[12, 12, 12, 12, 12, 12, 12] 


列表 解析 还 可 以 搭配 让 语句 ， 提 供 更 强大 的 功能 ， 如 查找 1362456737 是 谁 的 电话 号 码 : 


T 


>>>teldict={'mary':'1362456737','john':'13609822567','tom':'15920488245'} 
>>> [name for (name,tel) in teldict.iteritems() if tel—'1362456737'] 
['mary'] 


9.9 ”高 级 话题 : NumPy 的 数组 操作 


3.3.1 创建 数组 
NunPy 支持 多 个 创建 数组 的 函数 ， 见 表 3-1. 


表 3-1 NumPy 的 数组 创建 函数 


P 数 作 AN 例 
>>> numpy.array([[1,2],[3.4 
可 将 一 切 序列 型 的 对 象 《包括 数 aa a BAD 
Array 组 ) 转换 为 ndarray 对 象 ， 可 显 式 指 [3, 4]]) 
(序列 对 象 ) 3E dtype， 和 否则 会 自动 推 新 一 个 合适 >>> numpy.array([[1,2],[3,4]],dtype=floab 
的 数据 类 型 。 array([[ 1.， 2.]， 
[3. 4]D 
创建 一 个 有 N 个 元 素 的 列表 ， 取 >>> numpy.arange(5 
amange(N) | 值 分 别 为 0~N-1 的 整数 array([0， 12. 25 | 
>>> numpy.ones((2,3)) 
array([[ 1.， 1.， 1], 
根据 指定 的 维 数 和 类 型 创建 一 个 [1.，1.，1.) 
pest) 全 1 的 数组 >>> numpy.ones((2,3),dtype-int) 
array([[1, 1, 1], 
[L.1,1])) 
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( 续 ) 
K X TE zw 例 
ERT 根据 指定 的 维 数 和 类 型 创建 一 个 >>> numpy.zeros(4) 
全 0 的 数组 ， 与 ones 类 似 array([ 0.， 0.， 0.，0.]) 
创建 一 个 正方 的 N*N 单位 矩阵 | > numpy.eye(2) 
OD | (对 角 线 为 1， 其 余 为 0) dem 
根据 指定 的 维 数 和 类 型 创建 一 个 >>> numpy.empty(4) 
empty 数组 但 不 填充 任何 值 ， 数 组 元 素 值 array([ 5.81647661e-303, 2.32843656e-290, 2.35601343e-290, 
多 是 一 些 未 初始 化 的 垃圾 值 0.00000000e+000]) 
注意 : 在 使 用 表 中 的 函数 创建 数组 时 ， 如 果 没 有 显 式 地 指明 类 型 ， 则 数据 类 型 基本 都 是 


float64, TH: 


>>> a=numpy.eye(2) 
>>> a.dtype 
dtype('float64") 


3.3.2 ”索引 和 切片 
与 Python 列表 和 元 组 类 似 ，NumpPy 的 数组 也 可 以 索引 和 切片 ， 如 : 


>>> nar-numpy.array([1,2,3,4,5,6]) 
>>> nar[3] 

4 

>>> nar[2:5] 

array([3, 4, 5]) 

>>> nar[3:] 

array([4, 5, 6]) 


NumPy 的 数组 对 象 也 文 持 反 向 索引 ， 如 : 


>>> nar[-3:-1] 
array([4, 5]) 
>>> nar[-4:] 
array([3, 4, 5, 6]) 


也 可 以 利用 索引 和 切片 来 修改 数组 元 素 的 值 。 


>>> nar[3]-8 

>>> nar 

array([1, 2, 3, 8, 5, 6]) 
>>> nar[2:5]=9 

>>> nar 

array([1, 2, 9, 9, 9, 6]) 


NumPy 中 数组 切片 是 原始 数组 的 视图 ， 这 意味 着 数据 不 会 被 复制 ， 对 视图 做 的 任何 修 
改 都 会 反映 到 源 数组 上 。 
多 维 数组 中 可 以 指定 每 一 维 的 索引 来 访问 具体 的 数组 元 素 ， 如 : 


>>> nar-numpy.array([[1,2],[3,4]]) 
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>>> nar[1][0] 
3 


如 果 省 略 了 后 面 的 索引 ， 则 会 得 到 维度 低 一 些 的 ndarray, W: 


>>> nar3=numpy.array([[[1,2],[3.4]],[[5,61.r7.8]]D 
>>> nar3 
array([[[1, 2], 

[3, 4]], 


[[5. 6], 
[7, 8]]p 
>>> nar3[0][1] 
array([3, 4]) 
>>> nar3[1] 
array([[5, 6], 

[7, 8]) 
>>> narm3[1]-99 
>>> nar3 
array([[[ 1, 2]. 

[3, 4l 


[[99, 99], 
[99, 99]]]) 


也 可 以 在 切片 中 利用 “冒号 ”选取 低 维度 的 整个 轴 ， 然 后 对 高 维度 进行 切片 ， 如 : 


>>> nar3-numpy.array([[[1,2],[3,4]].[[5.6].[7.8]]]) 
>>> nar3[:,1] 
array([[3, 4], 
[7, 8]) 
>>> nar3[:,:,0] 
array([[1, 3], 
[5, 7]]) 


3.3.3 ”数组 对 象 的 属性 

(1) ndim 

表示 数组 轴 的 个 数 ， 在 NumPy 中 维度 (dimensions) 称 为 轴 (axis)， 轴 的 个 数 称 为 秩 
(rank)， 如 : 


>>> nar3 


array([[[1, 2], 
[3, 4]], 


[[5. 6], 
[7, 8TID 
>>> nar3.ndim 
3 
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(2) shape 
指示 数组 在 每 个 维度 上 大 小 的 整数 元 组 ， 如 : 


>>> nar3.shape 
(2, 2, 2) 


(3) size 
为 数组 元 素 的 总 个 数 ， 等 于 shape 属性 中 元 组 元 素 的 乘积 ， 如 : 


>>> nar3.size 
8 


(4) dtype 
述 数 组 中 元 素 类 型 的 对 象 ， 如 : 


>>> nar3.dtype 
dtype('int32') 


(5) itemsize 


表示 数组 中 每 个 元 素 所 占 字 节 的 大 小 ， 如 : 


>>> nar3 itemsize 
4 


因为 数组 元 素 的 类 型 为 ntg2， 所 以 每 个 元 素 占 的 字 节 数 为 32/8=4。 


3.3.4 ”数组 和 标量 之 间 的 运算 
使 用 NumPy 的 ndarray 对 象 ， 不 必 编 写 循 环 即 可 对 数据 执行 批量 运算 ， 如 ; 


a 


>>> a-numpy.array([[1,2],[3.4]]) 
>>> a*2 
array([[2, 4], 
[6, 8]]) 
22342 
array([[3, 4], 
[5. 6] 
>>> a-5 
array([[-4. -3], 
[-2. -1]) 
>>> a/3 
array([[O, 0], 
[1, 1] 
>>> a/3.0 
array([[ 0.33333333,  0.66666667], 
[ 1. , 1.33333333]] 
>>> a**2 
array([[ 1, 4] 
[ 9, 16]]) 
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3.3.5 数组 的 转 置 


NumPy 中 使 用 transpose 方法 实现 数组 转 置 ， 也 可 使 用 T 属性 访问 转 置 矩 阵 ， 如 : 


>>> nar 
array([[1, 2], 

[3, 4]D 
>>> nar.transpose() 
array([[1, 3], 

[2, 4]p 
>>> nar.T 
array([[1, 3], 

[2, 4]p 
>>> nar3 
array([[[1, 2], 

[3, 4]], 


[[5. 6], 

(7. 8]]]) 
>>> nar3.transpose() 
array([[[1. 5], 

[3, 7], 


[[2, 6], 
[4, 8]]]) 


对 于 高 维 数 组 ， 调 用 transpose0 时 ， 可 以 使 用 元 组 指定 如 何 对 这 些 轴 进行 转 置 ， 如 : 


>>> nar3.transpose((1,2,0)) 


array([[[1, 5]， 
[2. 6]], 


[B, 7], 
[4, 8]ID 


上 例 中 第 1 维 转 置 为 第 0 维 ， 第 2 维 转 置 为 第 1 维 ， 第 0 维 转 置 为 第 2 维 。 
3.3.6 ”通用 函数 


NumPy 提供 常见 的 数学 函数 如 abs、sqrt、exp 等 ， 对 数组 执行 元 素 级 运算 ， 并 
数组 。 常 用 的 通用 函数 见 表 3-2， 表 中 的 a, b 代表 NumPy 中 的 数组 。 


NU 


表 3-2 NumPy 通用 函数 


KO w 作 
abs(a). fabs(a) 求 各 元 素 绝对 值 ，fabs 速度 快 但 不 能 对 复数 数组 求 绝对 值 
ceil(a) 求 大 于 或 等 于 各 元 素 的 最 小 整数 
floor(a) 求 小 于 各 元 素 的 最 大 整数 


74 


第 3 章 ”控制 流程 与 运算 


( 续 ) 

Ko X 作 
rint(a) TES TUR UU d H.A 49 3362 
modf(a) 将 数组 的 整数 和 小 数 部 分 以 两 个 独立 数组 的 形式 返 巴 
exp(a) 求 各 元 素 的 指数 函数 e° 
log(a). log10(a)、 log2(a) 分 别 求 各 元 素 的 以 e、10 和 2 为 底 的 对 数 
loglp(a) 求 各 元 素 加 1 后 的 自然 对 数 
sqrt(a) 求 各 元 素 的 平方 根 
square(a) 求 各 元 素 的 平方 
isnan(a) 返回 一 个 布尔 型 数组 ， 判 断 各 元 素 值 是 不 是 NaN 
isfinite(a) 返回 一 个 布尔 型 数组 ， 判 断 各 元 素 值 是 不 是 有 穷 的 
isinf(a) 返回 一 个 布尔 型 数组 ， 判 断 各 元 素 值 是 不 是 无 穷 的 
cos(a), cosh(a). sin(a). sinh(a). tan(a). tanh(a) 求 各 元 素 的 普通 型 或 双 曲 型 三 角 函 数 
add(a,b) 将 数组 a、b 中 的 对 应 元 素 相 加 
subtract(a,b) a 数组 中 的 元 素 减 去 b 数组 中 的 对 应 元 素 
nultiply(a,b) 将 数组 a、b 中 的 对 应 元 素 相 乘 
divide(a,b)、floor divide(a,b) a 数组 中 的 元 素 除 或 地 板 除 b 数组 中 的 对 应 元 素 
power(a,b) J a 数组 元 素 为 底 ，b AHER ARVOR AUIE 
maximum(a,b), fmax(a,b) Ka b 相应 元 素 的 最 大 值 ，fmax 将 忽略 NaN 
minimum(a,b), fmin(ajb) Ka b 相应 元 素 的 最 小 值 ，fimin 将 忽略 NaN 
mod(a,b) a 数组 中 的 元 素 对 b 数组 中 的 对 应 元 素 求 余数 〈 求 模 ) 
copysign(a,b) 将 b 数组 元 素 的 正 负 号 复制 给 a 数组 的 相应 元 素 
greater(a,b) 、greater_equal(a,b) 、less(a,b) 、less_ | 比较 数组 a fi b 的 对 应 元 素 ， 并 最 终 产生 布尔 型 数组 

equal(a,b)、equal(a,b)、not_equal(a,b) 

logical and(a,b)、logical_or(a,b) 对 数组 a 和 b 的 对 应 元 素 进行 逻辑 与 、 或 、 非 运算 ， 并 最 终 产生 布尔 
logical xor(a,b) 型 数组 


3.3.7 ”统计 方法 


NumPy 可 以 方便 地 调用 统计 函数 对 整个 数组 或 菜 个 轴 向 的 数据 进行 统计 计算 ， 其 常用 
统计 函数 见 表 3-3。 


表 3-3 NumPy 统计 函数 


PEE 作 
max、 min 求 最 大 或 最 小 值 
sum 求 数组 中 所 有 元 素 或 某 轴 向 元 素 的 和 
mean 求 数组 元 素 的 算术 平均 数 ， 零 长 度 的 数组 的 算数 平均 数 为 NaN 
std 求 数组 元 素 的 标准 差 ， 度 可 调 
var 求 数组 元 素 的 方差 ， 度 可 调 
argmax. argmin 求 最 大 元 素 或 最 小 元 素 的 索引 
cumsum 求 所 有 元 素 的 累计 和 
cumprod 求 所 有 元 素 的 累计 积 
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NumPy 中 的 很 多 统计 方法 既 可 以 当 作 数组 的 实例 方法 调用 ， 也 可 以 作为 顶级 的 NumPy 
函数 调用 ， 如 ; 


>>> a-numpy.arange(12).reshape(3,4) 
>>> a 
array([[0, 1, 2, 3] 

[4, 5, 6 7] 

[8 , 9,10,11]] 


实例 方法 调用 : 


>>> r-a.cumsum() 
>>>T 


array([ 0， 1, 3, 6, 10, 15, 21, 28, 36, 45, 55, 66]) 


顶层 函数 调用 : 


cu 


>>> r-numpy.cumsum(a) 
>>>r 


array([0, 1, 3, 6,10, 15,21, 28, 36, 45, 55, 66]) 


338 ”集合 运算 


T 


NumPy 提供 了 对 一 维 数 组 进行 基本 集合 运算 的 函数 ， 见 3 


3-4。 表 中 的 a. b 均 为 一 维 


数组 。 
>>> a-numpy.array([2,3,7,4,3,9,3,5,2,7,9]) 
>>> b=numpy.array([7,8,6,0,3,2,1,7,8,3,6,3,9,8]) 
表 3-4 集合 运算 函数 
FR 数 作 用 zw 例 
删除 数组 中 的 重复 元 素 ， 并 返回 唯一 | >>> numpy.unique(a) 
Unique) — | 元 素 的 有 序 结果 array([2, 3,4 5, 7, 9]) 
: 查找 a 和 b 中 的 公共 元 素 ， 并 返回 公 | >>> numpy.intersectld(a;b) 
intersectld(ab) | 共 元 素 的 有 序 结果 array([2, 3, 7, 9) 
union1d(a,b) 求 a 和 b 的 并 集 ， 并 返回 有 序 结果 i sy 8,9) 
i [n] — 4 RAA nH oa Lm >>> numpy.inld(a,b) 
inld(a,b) ES Er MC 数组 ， ted ë _ 素 包 array([ True, True, True, False, True, True, True, False, 
E ^ JURTA True, FNY False True, True, True] dtype-bool) 
: 求 集合 a、b 的 差 ， 即 存在 于 a 中 但 不 | >>> numpy.setdiffld(a;b) 
ida) | 存在 于 b 中 的 元 素 array([4, S]) 
ixorld(a.b 求 集合 a、b 的 对 称 差 ， 即 存在 于 a 或 | >>> numpy.setxorld(a;b) 
werde) | b 中 但 不 同时 存在 于 a b 中 的 元 素 array([0, 1, 4, 5, 6, 8]) 


3.3.9. BüBU2X 


NumPy 的 random 模块 对 Python 中 的 random 模块 进行 了 扩展 补充 ， 增 加 了 一 些 用 于 高 
效 生成 多 种 概率 分 布 的 样本 值 的 函数 ， 见 表 3-5. 
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A © 
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BO S 作 
seed 确定 随机 数 生 成 器 的 种 子 
rand 产生 均匀 分 布 的 随机 数 
randint 产生 给 定 上 下 限 范围 内 的 随机 整数 
randn 产生 满足 正 态 分 布 〈 平 均值 为 0， 标 准 差 为 1) 的 随机 数 
normal 产生 正 态 (高 斯 ) 分 布 的 随机 数 
uniform 产生 在 上 下 限 间 均匀 分 布 的 随机 数 ， 上 下 限 如 果 省 略 ， 则 为 [0，1) 


Python 中 的 random 模块 一 次 只 能 产生 一 个 随机 数 ， 而 NumPy 的 random 模块 中 的 函数 


可 以 一 次 产生 大 量 的 随机 数 ， 如 ; 


>>> t-numpy.random.rand(4) 

>>>t 

array([ 0.15416284, 0.7400497, 0.26331502, 0.53373939]) 

>>> t-numpy.random.randint(3,9,10) 

>>>t 

array([7, 3, 4, 7, 8, 8, 4, 5, 6, 5]) 

>>> numpy.random.uniform(0,9,size-(2,3)) 

array([[ 2.55445518, |5.45474866, | 8.49802622], 
[7.67461987, 0.0203331 , 4.69103424]] 


3.3430 HEF 


Hm 


NumPy 中 的 数组 也 可 以 使 用 sort 函数 排序 ， 


>>> a=numpy.random.rand(6) 


| 多维 数组 可 以 在 任意 轴 


上 排序 ， 如 : 


>>>a 
array([ 0.55203763, 0.48537741, 0.76813415, 0.16071675, 0.76456045, 0.0208098 |) 
>>> a.sort() 

>>>a 

array([ 0.0208098 , 0.16071675, 0.48537741, 0.55203763, 0.76456045, 0.76813415]) 
>>> b-numpy.random.rand(4) 

>>>b 

array([0.13521018, 0.11627302, 0.30989758, 0.67145265]) 

>>> numpy.sort(b) 

array([ 0.11627302, 0.13521018, 0.30989758, 0.67145265]) 

>>> b 

array([ 0.13521018, 0.11627302, 0.30989758, 0.67145265]) 


H DL, sort 函数 既 可 以 作为 Numpy 的 顶层 函数 调用 ， 也 可 


H 


以 作为 数组 实例 的 方法 调 


的 是 数组 的 已 排序 融 本 ， 对 数组 本 身 没有 影 


用 。 如 果 作 为 Numpy 的 顶层 函数 调用 ， 返 
响 ， 如 果 作 为 数组 实例 的 方法 调用 ， 则 会 改变 数组 本 身 。 
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3.3.11 ”线性 代数 


NumPy 的 linalg 模块 支持 常见 的 线性 代数 操作 ， 如 求 算 阵 道 、 和 矩阵 乘法 、QR 分 解 等 ， 
见 表 3-6. 


表 3-6  numpy.linalg 模块 中 的 常用 函数 


函 数 作 

det 求 矩 阵 行列 式 

eig 求 矩 阵 的 特征 值 和 特征 向 量 

inv 求 方 阵 的 逆 

pinv CRAB II] Moore-Penrose £43 

qr QR 分 解 

svd 求 矩阵 的 奇异 值 分 解 
solve 求解 线性 方程 组 Ax=b， 其 中 A 为 一 个 方 阵 
lstsq 求解 线性 方程 组 Ax=b 的 最 小 二 乘 解 


NumPy 本 身 也 文 持 部 分 线性 代数 运算 ， 见 表 3-7。 


表 3-7 NumPy 中 常用 的 线性 代数 函数 


BO S 作 

diag 求 矩 阵 的 对 角 线 元 素 ， 可 用 参数 k 指定 求 哪 一 条 线 上 的 元 素 
dot 完成 矩阵 乘法 

trace 计算 对 角 线 元 素 的 和 


3.3.12 ”访问 文件 


1. 将 数组 以 二 进 制 方式 存 取 
使 用 save0 函 数 可 以 方便 地 将 数组 存 为 扩展 名 为 .npy 的 二 进 制 文件 ， 如 : 


>>>a 

array([[ 3.01182776, 8.80252271， 5.62123901], 
[ 8.55282172, 6.90728086, 7.42508328], 
[3.65976272, 4.0617757, 3.60568465]]) 

>>> numpy.save('d:\\nshz',a) 


车 没有 指定 扩展 名 ， 则 默认 为 .npy。 然 后 使 用 load0 函 数 可 以 读 取 保存 数组 数据 的 二 进 
制 文件 ， 如 : 


>>> c-numpy.load('d:Wnshz.npy") 
>>> c 


array([[ 3.01182776, 8.80252271， 5.62123901], 
[8.55282172, 6.90728086, 7.42508328], 
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[3.65976272, 4.0617757, 3.60568465]]) 


2. 存 取 文 本 文件 
NumpPy 使 用 savetxt() ll loadtxt() 函 数 存 取 文本 数据 ， 如 : 


>>>a 

array([[ 3.01182776, 8.80252271, 5.62123901], 
[8.55282172, 6.90728086, 7.42508328], 
[3.65976272, 4.0617757, 3.60568465]]) 

>>> numpy.savetxt('d:\npshz.txt',a,delimiter=',') 


代码 会 在 D: 盘 下 新 建文 件 “npshz.txt”， 其 内 容 如 图 3-3 所 示 。 


P npshz. txt - 记事 本 

文件 (EF) 编辑 (E) 格式 (0) 查看 (Y) 帮助 (8) 
3.011827761954501970e+00,8.802522711148670354e+00,5.621239005618171802e+00 
8.552821722295728790e+00,6.907280855584398083e+00,7.425083278932961051e+00 
3.659762716259955084e+00,4.061775702791828202e+00,3.605684646255062020e+00 


图 3-3 npshz.txt 文件 中 内 容 
NumPy 使 用 loadtxt0) 函 数 加 载 文本 文件 中 的 数据 ， 如 ， 


>>> ar-numpy.loadtxt('d:Wnpshz.txt' delimiter-',") 

ar 

array([[ 3.01182776, |8.80252271, 5.62123901], 
[8.55282172, 6.90728086, 7.42508328], 
[3.65976272, 4.0617757, 3.60568465]p 


小 结 


本 章 主 要 介绍 了 选择 结构 和 循环 结构 ， 介 绍 了 df 语句 、else 语句 、elif 语句 、while 语 


fij. for 语句 、break 语句 和 continue 语句 。 习 惯 了 其 他 编程 语言 的 读者 需要 注意 Python 中 的 
else 不 仅 可 以 与 if 语句 搭配 使 用 ， 而 且 可 以 与 while 和 for 语句 搭配 使 用 ， 如 果 循 环 不 是 通 
过 break 语句 跳出 ， 而 是 不 满足 循环 条 件 正常 结束 ，else 语句 就 会 被 执行 。Python 中 的 for i& 


句 不 同 于 其 他 语言 ， 其 功能 非常 强大 ， 可 以 遍历 可 迭代 对 象 ， 简 化 代码 并 使 其 高 效 运 行 。 高 
级 话题 中 延伸 了 第 2 章 中 的 Numpy， 介 绍 了 Numpy 的 数组 操作 。 
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43 RRI RRA EE 


在 程序 编写 中 ， 如 果 一 段 代 码 需 要 在 多 处 、 多 次 调用 ， 可 以 将 这 段 代码 编写 为 函数 ， 需 


L 


— 


44 函数 


与 许多 语言 一 样 ， 
定 的 功能 。 


4.1.1 定义 函数 


要 时 调用 即 可 。 通 常用 函数 来 完成 某 个 特定 功能 ， 函 数 是 将 程序 结构 化 和 过 程 化 的 重要 编程 
方法 。 使 用 自 定义 函数 不 仅 能 够 提高 编程 效率 、 代 码 利用 率 ， 而 且 能 够 使 程序 结构 更 规范 、 
青 晰 、 人 简洁、 便于 调试 和 维护 。 有 些 语言 区 分 过 程 和 函数 : 函数 有 返回 值 ， 过 程 没有 返回 
直 。Python 中 的 过 程 就 是 函数 ， 因 为 解释 器 会 隐 式 地 返回 默认 值 None。 


Python 编程 中 不 仅 可 以 使 用 内 建 函 数 ， 也 可 以 自己 编写 函数 来 完成 特 


Python 中 使 用 def 语句 来 定义 函数 ， 格 式 如 下 : 
def 函数 名 (参数 ) 


Apr 
函数 体 


《可 以 省 略 ， 但 推荐 编写 ， 便 于 日 后 维护 和 理解 ) 


return 返回 值 JARIK, WEK, Python 解释 器 会 返回 None) 


Ji HH 
(1) def 语句 的 功 


能 是 创建 一 个 函数 对 象 ， 并 赋值 给 某 


数 名 。 函 数 名 就 是 这 个 函数 对 


Bs 


象 的 引用 ， 相 当 于 函数 名 中 存 了 函数 对 象 的 地 址 。 
(2) Python 代码 的 层次 关系 是 通过 不 同 深度 的 代码 体现 的 ， 文 档 字 符 串 、 函 数 体 、 


return 语句 左 侧 需 对 齐 ， 且 相对 def 语句 缩 进 一 层 。 


(3) Python FK Zi 


参数 包括 所 有 的 必要 参数 、 关 键 字 参 数 和 默认 参数 ， 详 见 4.2 YH. 


(4) 文档 字符 串 必须 是 紧 跟 def. 语句 的 未 赋值 的 字符 串 ， 用 于 描述 函数 功能 和 如 何 使 用 
函数 等 ， 虽 然 可 以 省 略 ， 但 是 为 了 便于 日 后 维护 和 共享 代码 ， 建 议 编写 。 

(5) 函数 体 中 包含 完成 函数 功能 的 语句 ， 如 果 没 有 想 好 如 何 编写 ， 可 以 用 pass 语句 来 
占 位 ，Python 中 pass 语句 不 做 任何 事 ， 仪 标记 需要 完成 但 还 未 完成 的 代码 部 分 。Python f 


许 一 个 函数 的 定义 体 ! 


出 现 另 一 个 函数 的 定义 ， 详 见 4.1.3 小 节 。 


(6) return 语句 可 以 省 略 ， 如 省 略 ，Python 解释 器 会 返回 None. Python 允许 return i& 
名 返回 一 个 值 ， 也 允许 一 次 返回 多 个 值 ， 如 果 返 回 多 个 值 ，Python 把 它们 聚集 起 来 并 以 一 个 


元 组 返回 。 


下 面 利 用 函数 输出 “hello world”(ch4-1.py)。 


aX BAK nk Ude 


分 析 : 函数 的 功能 仅 为 输出 “hello world”， 不 需要 返回 值 ， 所 以 省 略 return 语句 。 


# -*- coding: utf-8 -*- 
def myprint(): 
"Print hello world' 
print 'hello world' 


myprint() 


运行 程序 ， 运 行 结果 如 下 : 


hello world 


可 以 通过 “函数 名 ， doc ”来 访问 函数 文档 字符 串 ， 如 下 : 


>>> myprint doc - 
'print hello world' 
下 面 利用 函数 求 矩 形 面 积 Cch4-2.py)。 
分 析 : 求 矩 形 面积 需要 知道 长 和 宽 ， 所 以 本 函数 需要 2 个 参数 ， 函 数 需要 得 到 矩形 面 
积 ， 所 以 有 一 个 返回 值 。 


# -*- coding: utf-8 -*- 
def rearea(L, W): 

area-L*W 

return area 
a=input(u' 请 输入 矩形 的 长 : ) 
b-input(u iif A EJER WE: 5) 
printu 和 矩形 面积 为 : "rearea(ab) 


运行 程序 ， 输 入 7，3 后 ， 运 行 结果 为 : 


丐 形 的 长 : 7 
请 输入 矩形 的 宽 : 3 
矩形 面积 为 : 21 
下 面 利 用 元 组 返回 多 值 函 数 示 例 〈ch4-3.py )。 
分 析 : 函数 中 让 用 户 输入 多 个 值 ， 然 后 将 其 全 部 作为 函数 结果 返回 。 


# -*- coding: utf-8 -*- 

defthree input(): 
a=raw_input(u'ii N28 8: 5 
b=raw_input(u' 请 输入 第 二 个 值 : ) 
c=raw_input(u' 请 输入 第 三 个 值 : ) 
return(a,b,c) 


print three input() 


程序 运行 结果 如 下 : 
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请 输入 第 一 个 值 : 001 
请 输入 第 二 个 值 : 002 
请 输入 第 三 个 值 : 003 
('001', '002', '003') 


表面 上 函数 返回 了 多 个 值 ， 实 际 只 是 一 个 元 组 对 象 而 已 。 
4.1.2 ”函数 调用 

定义 函数 后 ， 调 用 函数 的 形式 为 : 
函数 名 ( 实 参 ) 


说 明 : 

(1) 调用 时 括号 0 是 必须 的 ， 即 使 没有 实 参 ， 也 不 可 以 省 略 。 

(2) 可 以 用 函数 名 调用 函数 ， 也 可 以 将 函 NOUS 别 的 变量 后 ， 通 过 别 的 变量 来 调 
用 函数 ， 如 调用 ch4-1.py 中 的 函数 myprint: 


>>> myprint() 
hello world 

>>> mypt-myprint 
>>> mypt() 

hello world 


注意 ; 变量 赋值 时 ， 函 数 名 后 不 加 括号 0， 调 用 函数 时 加 括号 。 
(3) 调用 时 可 以 按照 定义 时 形 参 的 位 置 ， 输 入 适当 的 实 参 ， 也 可 以 利用 参数 名 = 实 参 的 
方式 来 指定 实 参 传 给 哪个 形 参 。 如 调用 ch4-2.py 代码 中 的 函数 rearea: 


>>> rearea(5,3) 

15 

>>> rearea(W-3,L—5) 
15 


注意 : 在 Python 3.x 中 ， 调 用 文件 中 自己 定义 的 函数 时 ， 需 按照 下 面 步骤 进行 操作 : 
(1) 将 文件 所 在 目录 添加 到 Python 的 搜索 目录 中 ， 详 见 6.1.1 小 节 。 

(2) 使 用 “from 文件 名 import 函数 名 ”的 方法 导入 函数 。 

(3) 调用 函数 。 


4.1.3 内 部 /内 内 函数 


在 4.1.1 小 节 中 提 到 过 Python 允许 在 一 个 函数 体 中 定义 另 一 个 函数 ， 如 果 一 个 函数 是 在 另 
个 函数 体内 创建 的 ， 那 么 这 个 函数 就 叫 作 内 部 函数 或 内 嵌 函 数 。 显 式 定 义 内 部 函数 的 格式 如 下 : 


def 外 部 函数 名 


def 内 部 函数 名 
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定义 了 内 部 函数 后 ， 整 个 内 部 函数 都 位 于 外 部 函数 的 作用 

方 都 不 能 对 其 进行 调用 。 
内 部 函数 也 可 以 使 用 lambda 语句 进行 定义 ， 详 见 4.4.1 小 节 。 
内 部 函数 示例 (ch4-4.py) 如 下 : 


Pun! 
3 


， 除 了 外 部 函数 ， 其 他 地 


# -*- coding: utf-8 -*- 
def fout(): 
no-23 
def fin(): 
ni-78 
return notni 


print fin() 


调用 外 部 函数 fout， 运 行 结果 如 下 : 


>>> fout() 
101 


如 果 直 接 调用 内 部 函数 fm， 则 会 出 错 : 


>>> fin() 


Traceback (most recent call last): 
File "<pyshell#24>", line 1, in «module 
fin() 


NameError: name 'fin' is not defined 


内 部 函数 fn 中 可 以 访问 外 部 函数 fout 中 的 局 部 变量 no， 这 是 因为 从 Python 2.2 开始 ， 
RFA ARO 函数 对 其 外 部 函数 的 局 部 变量 进行 访问 ， 详 见 4.5.3 小 节 。 


42 函数 参数 


Python 中 函数 参数 的 使 用 非常 灵活 ， 定 义 函 数 时 不 需要 指定 参数 的 类 型 ， 而 且 Python 
不 仅 允 许 用 户 使 用 固定 参数 ， 还 允许 用 户 使 用 可 变数 量 参数 ， 包 括 元 组 和 字典 。 总 的 来 说 ， 
Python 中 的 函数 参数 分 为 标准 化 参数 和 可 变数 量 参数 。 

424 标准 化 参数 

Python 中 标准 化 参数 与 多 数 语言 中 函数 的 参数 比较 像 ， 调 用 函数 时 必须 为 函数 的 所 有 标 
准 化 参数 提供 相应 实 参 ， 除 非 标准 化 参数 有 默认 值 〈 默 认 参 数 )。 

对 于 标准 化 参数 ， 调 用 函数 时 ， 如 果 不 是 以 “ 形 参 名 = 实 参 ” 的 方式 给 出 实 参 ， 则 实 参 
按照 位 置 一 一 传 给 相应 的 形 参 ， 除 去 默认 参数 ， 实 参 和 形 参 必须 一 一 对 应 。 
下 面 给 出 标准 化 参数 函数 示例 〈ch4-5.py)。 函 数 中 用 到 了 多 个 参数 ， 分 别 演示 用 位 置 和 
形 参 名 传递 参数 。 代 码 如 下 : 


# -*- coding: utf-8 -*- 
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def fargsex(a1,22,a3,24,5): 
t-[a1,a2,a3,a4,25] 


i=l 

for ta in t: 
print i, ta 
i=i+1 


print u" 按 照 位置 传 送 参数 fargsex('er','ty',4,'67','we')" 
fargsex(er,ty',4"67,we) 

print u" 按 照 形 参 名 传送 参数 fargsex(a3='er'a5='ty',al=4,a2='67',a4='we")" 
fargsex(a3='er',a5='ty',a1=4,a2='67',a4='we') 


程序 运行 结果 如 下 : 


按照 位 置 传送 参数 fargsex('er',ty'4,67' we") 
] er 

2 ty 

34 

467 


< 


按照 形 参 名 传送 参数 fargsex(a3='er',a5='ty',al=4,a2='67',a4='we') 


4we 


5ty 


定义 函数 时 ， 可 以 给 某 些 标准 化 参数 赋 初 值 ， 即 为 默认 参数 ， 默 认 参 数 在 调用 时 可 以 有 
对 应 的 实 参 ， 也 可 以 没有 ， 如 果 没 有 对 应 的 实 参 ， 则 默认 参数 会 取 默 认 值 。 

将 ch4-5.py 中 的 参数 a5 改 为 默认 参数 ， 碍 看 调用 函数 时 提供 和 不 提供 对 应 实 参 的 情 
况 。 代 码 (ch4-6.py) WH F: 


# -*- coding: utf-8 -*- 
def fargsex(a1,a2,a3,a4,a5=555): 
t=[a1,a2,a3,a4,a5] 


i=1 
for ta in t: 
print i, ta 
i=i+1 
print u" 默 认 参 数 没有 对 应 实 参 " 
fargsex('er','ty',4,'67') 


print u" 默 认 参 数 有 对 应 实 参 " 

fargsex('er','ty',4,'67',28) 

print u" 通 过 形 参 名 传递 参数 时 ， 默 认 参 数 没 有 对 应 实 参 " 
fargsex(a3-'er'a1—4,a2-'67',a4—' we") 
print u" 通 过 形 参 名 传递 参数 时 ， 默 认 参 数 有 对 应 实 参 " 
fargsex(a3='er',a5='ty',a1=4,a2='67',a4='we') 
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程序 运行 结果 如 下 : 


默认 参数 没有 对 应 实 参 
ler 

2ty 

34 

4 67 
5555 
默认 参数 
] er 
2ty 
34 
467 
528 
14 
267 
3 er 


对 应 实 参 


sç 


参 名 传递 


"A 
VEZ 


4 we 
5555 
14 
2 67 
3er 


4 we 
5ty 
运行 结果 可 见 ， 默 认 参 数 有 对 应 实 参 ， 


但 需要 注意 


第 4 章 “函数 与 函数 式 编程 


数 时 ， 默 认 参 数 没有 对 应 实 参 


递 参数 时 ， 默 认 参 数 有 对 应 实 参 


则 用 对 应 实 参 值 ， 否 则 用 默认 值 。 
的 是 ， 编 写 函数 时 ， 无 默认 值 的 标准 化 参数 必须 写 在 默认 参数 之 前 。 


将 例 ch4-6.py ' 
7.py) HH F: 


# -*- coding: utf-8 -*- 
def fargsex(a1,a2,a3,a4—444,a5): 
t-[a1,a2,a3,a4,a5] 
i-1 
for ta in t: 
print i, ta 
i=i+1 
fargsex('er','ty',4,'67') 
print u" 默 认 参 数 有 对 应 实 参 " 
fargsex('er','ty',4,'67',28) 


print u" 


print u" 通 过 


的 参数 a4 改 为 默认 参数 ， 而 a5 改 为 无 默认 值 的 情况 ， 代 码 (ch4- 


2 参 名 传递 参数 时 ， 默 认 参 数 没 有 对 应 实 参 " 


fargsex(a3—'er'a1—4,a2-'67',a4—' we") 
print u" 通 过 形 参 名 传递 参数 时 ， 默 认 参 数 有 对 


fargsex(a3—'er',a5-'ty',al—4,a2-'67,a4—" we") 


应 实 参 " 
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运行 时 ， 会 出 现 语法 错误 ， 如 图 4-1 所 示 。 


Syntax error 


(x) There's an error in your program: 


x** non-default argument follows default argument (E:/python/ch4/aLlüÁ&/4-6.py, line 2) 


图 4-1 默认 参数 写 在 无 默认 值 的 标准 化 参数 前 导致 的 错误 


为 函数 设置 默认 参数 ， 既 为 函数 提供 了 很 大 的 灵活 性 ， 又 能 够 使 Python 用 户 在 不 熟练 
的 情况 下 ， 不 需要 面 对 大 量 的 参数 ， 由 程序 的 设计 者 提供 一 个 相对 “最 佳 ” 的 默认 值 。 


422 ”可 变数 量 的 参数 

有 时 在 编写 函数 时 ， 并 不 知道 要 处 理 的 参数 数目 ， 甚 至 在 函数 调用 时 参数 的 数目 都 是 变 
化 的 。 显 然 标 准 化 参数 无 法 满足 这 种 要 求 。Python 提供 两 种 方法 来 处 理 可 变数 量 的 参数 : 非 
关键 字 可 变数 量 参数 和 关键 字 可 变数 量 参数 。 

1. 非 关 键 字 可 变数 量 参数 〈 元 组 ) 

定义 非 关 键 字 可 变数 量 参数 时 ， 参 数 名 前 用 星 号 “*” 引 导 ， 定 义 函 数 时 ， 其 位 置 必须 
在 标准 化 参数 之 后 。 有 非 关 键 字 可 变数 量 参 数 时 ， 函 数 头 形式 如 下 : 


def 函数 名 ([ 标 准 化 参数 ,] * 非 关键 字 可 变数 量 参数 ) 


有 了 非 关 键 字 可 变数 量 参数 后 ， 调 用 函数 时 所 有 的 多 余 的 无 关键 字 指 定 的 实 参 (匹配 标 
准 化 参数 后 剩余 的 ) 统统 以 元 组 的 形式 保存 在 非 关 键 字 可 变数 量 参数 中 。 
下 面 是 具有 非 关 键 字 可 变数 量 参数 的 函数 的 实例 〈ch4-8.py)。 本 例 编写 了 具有 非 关键 字 
可 变数 量 参数 的 函数 ， 演 示 非 关键 字 可 变数 量 参数 如 何 定义 和 调用 。 


# -*- coding: utf-8 -*- 
def ftuple(arg1,arg2,arg3—333, *arg4): 
print 'arg1—'argl 


F. 


print 'arg2=',arg2 
print 'arg3=',arg3 
print 'the rest args:' 
for eacharg in arg4: 
print eacharg, 


使 用 不 同 数 目的 实 参 来 调用 函数 ， 观 察 函数 的 执行 情况 : 


>>> ftuple(1,2,3) 
formal args: 
argl- 1 

arg2= 2 

arg3= 3 

the rest args: 
>>> ftuple(1,2) 
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formal args: 
argl- 1 
arg2- 2 
arg3= 333 
the rest args: 


>>> ftuple(1,2,3,4,5,6,7) 


formal args: 
argl- 1 
arg2- 2 
arg3- 3 

the rest args: 
4567 


NELLE 
s X Oct n] e cA 


须 在 


标准 


= 


关键 字 可 变数 量 参数 之 后 。 有 关键 字 可 变数 量 参数 时 ， 
函数 名 ([ 标 准 化 参数 ,] [* 非 关键 字 可 变数 量 参数 ,] 关键 字 可 变数 量 参数 ) 


de 


= 


量 参数 〈 元 组 ) 


参数 时 ， 


参数 名 前 用 两 个 星 写 “**” 引 导 ， 定 义 函 数 时 ， 其 位 置 必 


有 了 关键 字 可 变数 量 


化 参数 名 的 ) 统统 以 字典 的 形式 
直 为 相应 的 参数 值 。 


EUG. WO BR 


函数 头 形式 如 下 : 


数 时 所 有 的 多 余 的 有 关键 字 指 定 日 


# -*- coding: utf-8 -*- 
def fdict(arg1,arg2,arg3—-333,**arg4): 


print 'formal 


args:' 


print 'argl=',arg1 


print 'arg2=",arg2 


print 'arg3—'arg3 


print 'the rest args:' 


for eachargkey in arg4: 


print e 


>>> fdict(1,2) 
formal args: 
argl- 1 

arg2- 2 

arg3= 333 

the rest args: 
>>> fdict(1,2,3) 
formal args: 
argl- 1 

arg2- 2 

arg3- 3 


"n.n 


achargkey,":",ar 


的 实 参 〈 关 键 字 非 


保存 在 关键 字 可 变数 量 参数 中 ， 字 典 


的 键 为 参数 名 ， 


具有 关键 字 可 变数 量 参 数 的 函数 的 实例 如 下 (ch4-9.py)。 


g4[eachargkey] 


使 用 不 同 数目 的 实 参 来 调用 函数 ， 观 察 函数 的 执行 情况 : 
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the rest args: 

>>> fdict(1,2,er-3) 

formal args: 

argl- 1 

arg2- 2 

arg3= 333 

the rest args: 

er:3 

>>> fdict(we-1,ui-2,arg1-3,arg2-4) 


formal args: 
argl- 3 
arg2- 4 
arg3= 333 
the rest args: 
we:l 


u:2 
需要 注意 的 是 : 调用 函数 时 ， 如 果 有 的 实 参 给 定 关 键 字 或 参数 名 ， 有 的 没有 给 定 ， 则 不 
给 定 的 放 在 实 参 列表 的 前 面 ， 给 定 的 放 在 后 面 。 
下 面 演示 同时 具有 非 关 键 字 可 变数 量 参 数 和 关键 字 可 变数 量 参 数 的 函数 (ch4-10.py)。 
# -*- coding: utf-8 -*- 


def ftupdict(arg1,arg2,arg3=333,*arg4,**arg5): 


print 'formal args:' 


aq 


print 'argl=',arg1 
print 'arg2=",arg2 
print 'arg3—'arg3 
printu 非 关键 字 可 变数 量 参数 : 


for eacharg in arg4: 


print eacharg, 
printu 关 键 字 可 变数 量 参数 
for eachargkey in arg5: 


"n.n 


print eachargkey,": 


使 用 不 同 数目 的 实 参 来 调用 函数 ， 观 察 函数 的 执行 情况 : 


,argS[eachargkey] 


>>> ftupdict(1,2) 

formal args: 

argl- 1 

arg2= 2 

arg3= 333 

非 关 键 字 可 变数 量 参数 : 
关键 字 可 变数 量 参数 : 
>>> ftupdict(1,2,3) 


formal args: 


argl- 1 
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arg2- 2 

arg3- 3 

非 关 键 字 可 变数 量 参数 : 
>>> ftupdict(1,2,yu-3,gh-5) 


formal args: 


argl- 1 

arg2- 2 

arg3= 333 

非 关 键 字 可 变数 量 参数 : 
yu:3 

gh:5 


>>> ftupdict(1,2,3,5,6,4,u1-3,yu-8) 


formal args: 

argl- 1 

arg2- 2 

arg3- 3 

非 关 键 字 可 变数 量 参数 : 
564 

yu:8 


ui:3 


423 WX 
在 44.22 小 节 中 讲 过 ， 可 以 将 函数 对 象 赋值 给 别 的 变量 后 ， 通 过 别 的 变量 来 调用 函数 。 


Python ! 


H 
调 


的 函数 对 象 也 可 以 作为 别 的 函数 的 参数 。 


Python 中 所 有 的 对 象 作 参 数 都 是 通过 引用 来 传递 的 ， 函 数 对 象 也 不 例外 。 通 过 函数 调 


下 面 通过 一 个 简单 例子 讲解 函数 对 象 作 参 数 如 何 定义 与 调用 ，ch4-11.py 是 将 序列 中 的 


昌 ， 将 实 参 函数 对 象 的 引用 传递 给 形 参 函数 对 象 ， 然 后 就 可 以 利用 形 参 函 数 对 象 进行 函数 


每 个 元 素 加 2 的 实例 。 实 际 上 ， 本 例 正 常情 况 使 用 列表 解析 一 条 语句 即 可 实现 ， 采 用 该 编写 
方式 只 为 讲解 如 何 利用 函数 传递 。 


# -*- coding: utf-8 -*- 
def f(x): 

return x+2 
def ff(fun,seq): 


return [fun(eachn) for eachn in seq] 


调用 函数 任 ， 运 行 结果 如 下 : 


>>> ff(£,[1,2,3,4,5,6]) 
[3, 4, 5, 6, 7, 8] 
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43 ”装饰 器 


Python 允许 使 用 装饰 器 对 函数 进行 装饰 ， 这 样 编写 函数 时 就 可 以 专注 于 功能 的 实现 ， 而 
装饰 器 可 以 帮助 函数 实现 一 些 通用 的 功能 ， 在 函数 调用 前 运行 些 预 备 代 码 或 函数 调用 后 执行 
些 清理 工作 。 比 如 : 插入 日 志 、 检 测 性 能 (通过 计时 ) 和 事务 处 理 等 。 
装饰 器 其 实 也 是 一 个 函数 ， 一 个 用 来 包装 其 他 函数 的 函数 ， 包 闭 后 返回 一 个 装饰 后 的 函 
数 对 象 ， 该 函数 对 象 将 更 新 原 函 数 对 象 ， 程 序 将 不 再 能 访问 原始 函数 对 象 。 

Python 中 使 用 装饰 器 的 过 程 为 : 

(1) 定义 装饰 器 函数 ， 假 设 装饰 器 函数 的 名 称 为 decol. 

(2) 使 用 装饰 器 ，@decol。 

(3) 定义 被 装饰 的 函数 ， 假 设 函 数 名 为 fun1， 则 装饰 器 decol 装饰 了 函数 fun1， 这 里 

@decol 
def funl() 
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Sfr T. fun1=decol(fun1) 
Python 也 允许 使 用 多 个 装饰 器 装饰 一 个 函数 ， 如 : 
@decol 


@deco2 
def funl() 


等 价 于 funI-decol(deco2(funl)) 

既然 装饰 器 是 一 个 函数 ， 那 么 装饰 器 也 可 以 有 参数 ， 所 以 装饰 器 分 为 带 参 数 装饰 器 和 无 
参数 装饰 器 两 种 。 

4.3.1 ĒRCES 


下 面 通 过 一 个 简单 例子 讲解 无 参数 装饰 器 的 使 用 方式 及 作用 ， 例 如 利用 装饰 器 统计 函数 
的 执行 时 间 (ch4-12_1.py)。 通 过 导入 time 模块 用 于 时 间 的 记录 和 计算 。 


# -*- coding: utf-8 -*- 

import time 

# 定义 一 个 计时 函数 ， 其 参数 为 一 个 函数 ， 用 于 接收 被 装饰 的 函数 

deftime stt(func): 
# ë X VIII LA ERG ESR PR 28 8 EST TRAIT CER TRU 
def wrapper(): 


start = time.time() 

func() 

usetime-time.time()-start 

print u'JAAT PAZ, func. name  ,u' HH] usetime, f" 
# 返 回 包 装 后 的 函数 


return wrapper 
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def test(): 
time.sleep(4) 
test() 
程序 运行 结果 为 : 
执行 函数 test 用 时 4.0 秒 
本 例 中 定义 的 装饰 器 函数 time stt 有 一 定 的 通用 性 ， 可 以 装饰 任何 没有 参数 的 函数 ， 统 
计 其 运行 用 时 。 但 如 果 用 它 装饰 有 参数 的 函数 就 会 出 错 。 现 在 为 实例 中 的 test 函数 添加 参 
数 ， 并 装饰 调用 ， 修 改 后 代码 Cch4-12 2.py) 如 下 : 


# -*- coding: utf-8 -*- 


import time 


# 定义 一 个 计时 函数 ， 其 参数 为 一 个 函数 ， 用 于 接收 被 装饰 的 
deftime stt(func): 
# ë X VICIT LA ERU ESR ERO A EST TRAIT CER TRU 


def wrapper(): 
start = time.time() 
func() 
usetime-time.time()-start 
print 执行 函数 ,func， name  ,v' 
# 将 包装 后 的 函数 返回 
return wrapper 
(Qtime stt 
def test(n): 
time.sleep(n) 
test(4) 


"JF, Python 报错 如 下 : 


] 时 ',usetime,' 秒 ' 


> 


运行 


Traceback (most recent call last): 
File "E:/python/ch4/ 源 代码 /ch4-12_2.py", line 16, in «module» 
test(4) 
TypeError: wrapper() takes no arguments (1 given) 


如 何 改正 这 个 错误 ， 并 让 装饰 器 函数 decol 能 够 装饰 有 任 


# -*- coding: utf-8 -*- 


import time 


日 到 4.2.2 小 节 讲 到 的 可 变数 量 参数 。 修 改 ch4-122.py 代码 


意 多 个 任意 参数 的 函数 呢 ? 这 
马 如 下 (ch4-12 3.py): 


# 定义 一 个 计时 函数 ， 其 参数 为 一 个 函数 ， 用 于 接收 被 装饰 的 
deftime stt(func): 
# ë X VICIT 4928: ERU ESR ERO 8 EST RTT CERT TRU 
def wrapper(*t,**d): 
start = time.time() 
func(*t,**d) 
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usetime-time.time()-start 
print u'JAAT PAZ, func. name  ,u' HH usetime, f" 
# 将 包装 后 的 函数 返回 
return wrapper 
print u' 闭 饰 无 参数 函数 试验 :' 
(Qtime stt 
def test(): 
time.sleep(3) 


n 


test() 
print 
print u 装 饰 一 个 参数 函数 试验 : 
(Qtime stt 
def pr(n): 
for iin range(n): 
print i, 


print 


pr(4) 
pr(n=6) 
print 
print u 装 饰 两 个 参数 函数 试验 : 
(Qtme stt 
def area(Lw): 


print U 面 积 为 : ,1l#w 


area(40,23) 
area(w-23,1-40) 


程序 运行 结果 如 下 : 


装饰 无 参数 函数 试验 : 
执行 函数 test 用 时 3.0 fb 


装饰 一 个 参数 函数 试验 : 

0123 

执行 函数 pr 用 时 0.0460000038147 秒 
012345 
执行 函数 pr 用 时 0.047000169754 fh 


装饰 两 个 参数 函数 试验 : 

面积 为 : 920 

执行 函数 area 用 时 0.0320000648499 # 
面积 为 : 920 

执行 函数 area 用 时 0.0149998664856 秒 


可 见 通过 为 内 骨 函 数 wrapper 和 参数 函数 func 增加 可 变数 量 参数 *t,**d， 使 得 decol 的 
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通用 性 增强 ， 可 以 装饰 有 任意 多 个 参数 的 函数 ， 并 且 装 
EF EBR) 调用 。 
4.3.2” 带 参数 装饰 器 

带 参 数 的 装饰 器 使 用 格式 如 下 : 


@ 装 饰 器 函数 (装饰 参数 ) 
def 被 装饰 函数 (参数 ) 


P£ 
IT 
= 


后 的 函数 调用 时 可 以 带 或 者 不 带 关 


带 参数 的 装饰 器 函数 必须 返回 一 个 函数 对 象 ， 该 函数 对 象 才 是 真正 装饰 函数 的 装饰 器 ， 


如 : 
(Qdeco(deco arg) 
def fun() 
等 价 于 fun- deco(deco arg)(fun). 


无 参数 装饰 器 格式 如 下 : 


@decol 
def funl() 


a8 


Xr T. funl7decol(funl) 

两 者 比较 可 以 明白 带 参数 装饰 器 
回 值 必须 是 一 个 函数 。 
下 面 用 装饰 器 记录 函数 开始 调用 的 时 间或 结束 的 时 间 (ch4-13.py)。 本 例 是 采用 带 参数 装 
饰 器 ， 根 据 装 饰 器 的 参数 选择 是 记录 函数 开始 调用 的 时 间 还 是 函数 结束 的 时 间 。 


症 


ES] 


FE 起 装饰 作用 的 是 deco(deco arg), BH deco 函数 的 返 


# -*- coding: utf-8 -*- 
import time 
def decselect(sel): 
def startdec(func): 
def r(*t,**d): 
print 下面 调用 函数 : ',func. name _,u' 开 始 调 用 时 间 为 : "time.ctime() 
func(*t,**d) 
return r 
def enddec(func): 
def r(*t,**d): 
func(*t,**d) 
print 了 函数 : 'func. name Ju 于 ',time.ctime0,u 调 用 结束 ' 
return r 


try: 
return ('start'startdec,'end':enddec } [sel] 
except KeyErrore: 
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raise ValueError(e),u 必须 是 “start” 或 “end”， 


@decselect('end') 

def sp(seq): 
"i b — 89 
for n in seq: 


print n, 


print 
sp([1,2,3,4,5,6]) 
程序 运行 结果 如 下 : 


123456 
函数 : sp 于 Fri Jan 30 13:59:19 2015 调用 结束 


如 果 采 用 decselect('start] 对 函数 sq 进行 装饰 ， 


(Q)decselect('start") 
def sp(seq): 
"i b — 8I 
for n in seq: 


print n, 


print 
sp([1.2,3,4,5,6]) 
则 执行 结果 如 下 : 


下 面 调 用 函数 : sp 
123456 


始 调用 时 间 为 : 


44 HERE 


如 : 


Fri Jan 30 14:05:18 2015 


什么 是 函数 式 编程 ? 维基 百科 解释 如 下 : 函数 式 编程 (Functional programming) rk hd 


数 程序 设计 ， 又 称 uz 函 编程 ， 是 种 编程 范 型 ， 它 


且 避 免 使 用 程序 状态 以 及 易 变 对 象 。 


calculus)。 而 且 和 演算 的 函数 可 以 接受 函数 当 作 输入 


函数 编程 语言 最 习 


将 计算 机 运算 视 为 数学 上 的 函数 计算 ， 并 


Python 昌 然 不 是 函数 式 编 程 语言 ， 但 是 吸收 了 入 
绍 的 Python 中 的 函数 可 以 作为 函数 的 参数 也 可 以 作为 函数 的 ; 
语句 和 偏 函 数 应 用 。 


Python 支持 的 函数 式 编程 语言 方面 的 函数 、 


4.4.1 lambda 表达 式 


Python 允许 用 关键 字 lambda 创建 匿名 函数 。 创 建 格式 如 下 ; 


94 


重要 的 基础 是 


GIZO Mih 
多 函数 式 编 程 语言 的 优点 ， 比 如 前 面 介 


是 入 演算 (lambda 
H 〈 传 出 值 )。 


返回 值 。 本 节 将 主要 介绍 


lambda [参数 1[, 参 数 2[……[, 参 数 N]]]: 表 达 式 
说 明 : 
(1) lambda 中 的 表达 式 必须 与 声明 放 在 同一 行 。 
(2) lambda 的 参数 是 可 选 的 ， 参 数 不 需 加 括号 。 
下 面 把 ch4-2.py 中 的 求 矩 形 面积 的 函数 改写 成 lamda 创建 的 匿名 函数 。 
def 定义 的 函数 形式 : 


def rearea(L,W): 
area-L*W 


return area 


lambda 定义 的 匿名 函数 : 


lambda L,W: L*W 


与 普通 函数 相 比 ，lambda 定义 了 一 个 匿名 函数 ， 所 以 没有 函数 名 ， 其 结果 也 不 使 用 
return 语句 返回 。 
lambda L,W :L*W 只 是 创建 了 一 个 匿名 函数 ， 既 没有 使 用 名 字 将 其 保存 下来， 也 没 
有 调用 它 。 这 个 函数 的 引用 计数 在 函数 创建 时 被 设置 为 True， 但 因为 没有 引用 保存 下 
来 ， 计 数 又 回 到 了 零 ， 然 后 被 当 作 垃 圾 回收 掉 。 为 了 保留 并 调用 这 个 函数 ， 可 以 将 这 个 
匿名 函数 赋 给 一 个 变量 ， 通 过 变量 来 调用 函数 ， 也 可 以 将 匿名 函数 用 作 函 数 参 数 ， 通 过 
函数 参数 来 调用 。 
赋值 给 变量 : 


>>> y-lambda L,W : L*W 
>>> y(3,4) 
12 


用 作 函 数 参数 : 


>>> #u' 首 先 定 义 一 个 使 用 函数 参数 的 函数 ' 
>>> def area(fun,seq1): 

seq=[] 

for (x,y) in seq1: 

seq.append( fun(x,y)) 

return seq 
>>> 加 ' 调 用 时 使 用 lambda 语句 创建 的 匿名 函数 作 实 参 ' 
>>> area(lambda L,W : L*W,[(1,2),(3,4),(5,6)]) 


[2, 12, 30] 
创建 匿名 函数 时 也 允许 使 用 默认 参数 和 可 变数 量 的 参数 。 
默认 参数 : 

>>> f-lambda L,W=3 : L*W 

>>> f2) 

6 
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>>> f0,6) 
12 


可 变数 量 参数 : 
>>> f-lambda *s: s 


>>> f(1,2,3,4,5,6) 
(1, 2, 3, 4, 5, 6) 


44.2 JjrRZX map. filter. reduce 


本 小 节 介 绍 Python 的 内 建 函 数 map、reduce、filter， 这 些 内 建 函 数 具 有 函数 式 编程 的 特 
征 ， 并 且 它 们 都 有 一 个 可 执行 的 函数 对 象 参数 ， 这 个 参数 可 以 由 4.4.1 小 节 介 绍 的 lambda 创 
建 的 匿名 函数 担当 ， 也 可 以 由 def 定义 的 函数 担当 。 
1. map 函数 
map 函数 的 使 用 格式 为 ; 
map( 函 数 或 lambda 表达 式 ,序列 1[, 序 列 2……]) 
功能 : 将 函数 或 lambda 表达 式 作 用 于 给 定 序列 的 每 一 个 元 素 ， 并 用 一 个 列表 来 提供 返 
回 值 ， 如 果 调 用 时 给 定 了 多 个 序列 ， 则 map 会 并 行 迭 代 每 个 序列 。 每 次 处 理 时 ，map 会 将 每 


个 序列 的 相应 元 素 组 成 一 个 元 组 ， 然 后 将 函数 或 lambda 表达 式 作用 于 该 元 组 。 
例 : 


>>> map(lambda x:x*x,[2,6,4,8]) 

[4, 36, 16, 64] 

>>> map(lambda x,y:x*y,[1,2,3,4],[9,8,7,6]) 
[10, 10, 10, 10] 


有 时 map 函数 可 以 被 列表 解析 取代 ， 例 如 : 


>>> map(lambda x:x*x,[2,6,4,8]) 


d 
= 
H 


>>> [x*x for x in [2,6,4,8]] 


如 果 map 函数 中 的 函数 名 或 lambda 表达 式 为 None， 则 返回 一 个 列表 ， 列 表 的 每 个 元 素 
为 一 个 元 组 ， 由 各 个 序列 相应 元 素 组 成 ， 其 功能 类 似 内 建 函 数 zip, W: 


>>> map(None,[1,2,3,4],[5,6,7,8]) 

[(1, 5), (2, 6), (3, 7), (4, 8)] 

>>> zip([1,2,3,4],[5,6,7,8]) 

[(1, 5), (2, 6), (3, 7), (4, 8)] 

>>> >>> map(None,[1,2,3,4],[5,6,7,8],[11,22,33,44]) 
[(1, 5, 11), (2, 6, 22), (3, 7, 33), (4, 8, 44)] 

>>> zip([1,2,3,4],[5,6,7,8],[11,22,33,44]) 

[(1, 5, 11), (2, 6, 22), (3, 7, 33), (4, 8, 44)] 
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当 序列 长 度 不 同时 ，zip 函数 将 在 最 短 的 序列 结束 时 结束 ， 而 map 将 给 较 短 的 序列 添加 
None 元 素 ， 以 便 与 较 长 序列 补 齐 ， 如 : 


>>>zip([1,2,3,4],[5,6,7,8,9],[11,22,33,44,55,66]) 

[(1, 5, 11), (2, 6, 22), (3, 7, 33), (4, 8, 44)] 

>>> map(None,[1,2,3,4],[5,6,7,8,9],[11,22,33,44,55,66]) 

[(1, 5, 11), (2, 6, 22), (3, 7, 33), (4, 8, 44), (None, 9, 55), (None, None, 66)] 


2. filter 函数 
filter 函数 的 使 用 格式 为 : 

filter( 函 数 或 lambda 表达 式 ,序列 ) 
功能 : 利用 函数 或 lambda 表达 式 对 序列 中 的 每 个 元 素 进 行 筛选 ， 保 留 函数 值 为 True 的 

元 素 序列 。 

例如 ， 筛 选 出 序列 中 的 奇数 : 

>>> def odd(n): 

if n%2: 


return True 


>>> filter(odd,[1,2,3,4,5,6,7,8,9]) 

[1, 3, 5, 7, 9] 

>>> filter(lambda n:bool(n962),[1,2,3,4,5,6,7,8,9]) 
[1, 3, 5, 7, 9] 

>>> filter(lambda n:n962,[1,2,3,4,5,6,7,8,9]) 

[1, 3, 5, 7, 9] 


3. reduce 函数 


reduce 函数 的 使 用 格式 为 : 
reduce (函数 或 lambda 表达 式 ,序列 [初始 人 


]) 


功能 : 函数 或 lambda 表达 式 必 须 是 二 元 函数 〈 两 个 操作 数 ) ， 如 果 有 初始 值 ， 则 先 把 
初始 值 和 序列 的 第 一 个 元 素 作 为 函数 参数 ， 求 得 返回 值 后 ， 再 将 返回 值 和 序列 的 第 二 个 元 素 
作为 函数 参数 ， 依 此 类 推 ， 直 至 序列 最 后 一 个 元 素 。 如 果 省 略 初始 值 ， 则 先 把 序列 的 第 一 个 
和 第 二 个 元 素 作为 函数 参数 ， 求 得 返回 值 后 ， 再 将 返回 值 和 序列 的 第 三 个 元 素 作 为 函数 参 
数 ， 依 此 类 推 ， 直 至 序列 最 后 一 个 元 素 。 

例 : 


>>> reduce(mul,[1,2,3,4,5,6],10) 

7200 

>>> reduce(mul,[1,2,3,4,5,6]) 

720 

>>> reduce(lambda x,y:x*y,[1,2,3,4,5,6]) 
720 
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>>> reduce(lambda x,y:x*y,[1,2,3,4,5,6],10) 
7200 


4.4.3. Ji EFC JH 


在 使 用 标准 化 参数 时 ， 如 果 函 数 参数 偏 多 ， 可 以 设置 默认 人 参数， 降低 函数 调用 的 复杂 
度 。 但 是 因为 函数 应 用 领域 的 不 同 ， 使 得 不 同 函 数 的 调用 者 可 能 会 希望 参数 是 不 同 的 默认 
值 ， 这 时 就 可 以 利用 Python 的 functools 模块 提供 的 partial 函数 〈 偏 函数 )， 将 带 有 n 个 参数 
的 函数 ， 固 化 一 个 参数 (如果 不 指 定 关 键 字 ， 则 固化 第 一 个 参数 )， 并 返回 男 一 个 带 有 n-1 
个 参数 的 函数 对 象 。 固 化 参数 的 值 可 以 根据 需要 指定 。 
下 例 中 定义 一 个 函数 计算 应 缴 税额 。 
应 缴 税额 = (商品 单价 -免税 额 )X 商品 数量 X 税 率 


c 


函数 定义 如 下 : 
>>> def tax(slprice,jnumber,m): 
if priceczm: 
return 0 


else: 


return sl*(price-m)*number 


其 中 sl 代表 税率 ，price 代表 单价 ，number 代表 购买 数量 ，m 代表 免税 额 。 
假设 税率 是 0.01， 则 将 函数 tax 的 sl 固化 为 0.01， 如 下 : 


>>> tax]=partial(tax,0.01) 


调用 tax1 时 ， 只 需 给 出 price, number 和 m 三 个 参数 值 : 


>>> tax1(20000,5,10000) 
500.0 


此 调用 等 价 于 


>>> tax(0.01,20000,5,10000) 
500.0 


如 果 税 率 是 0.05， 则 可 将 函数 tax 的 sl 固化 为 0.05， 如 下 : 
>>> tax5-partial(tax,0.05) 
调用 tax5 时 ， 只 需 给 出 price, number 和 m 三 个 参数 值 : 


>>> tax5(20000,3,10000) 
1500.0 


此 调用 等 价 于 


>>> tax(0.05,20000,5,10000) 
1500.0 


现在 不 想 固化 税率 ， 而 想 固 化 免税 额 ， 假 设 将 免税 额 固 化 为 10000， 应 该 怎么 做 ? 
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利用 tax10000=partial(tax,10000) 将 免税 额 固化 为 10000， 显 然 是 不 可 以 的 ， 因 为 不 指定 
关键 字 的 话 ，partial 默认 第 一 个 参数 为 固化 参数 ， 正 确 的 做 法 为 ; 


>>> tax10000=partial(tax,m=10000) 
调用 tax10000 时 ， 只 需 给 出 sl，price 和 number 三 个 参数 值 : 


>>> tax10000(0.01,20000,5) 
500.0 


此 调用 等 价 


>>> tax(0.01,20000,5,10000) 
500.0 


45 变量 作用 域 


变量 作用 域 即 变量 在 程序 中 的 可 应 用 范围 ， 或 变量 的 可 见 性 。Python 是 静态 作用 域 语 
言 ， 也 就 是 说 ， 在 Python 中 变量 的 作用 域 是 由 它 在 源 代 码 中 的 绑 定 位 置 决定 的 。 

在 Python 2.1 版 本 之 前 ， 变 量 作用 域 分 为 全 局 作用 域 和 局 部 作用 域 两 种 ， 后 来 由 于 舱 套 
函数 和 闭 包 的 应 用 与 发 展 ， 自 Python 2.2 开始 ， 变 量 的 作用 域 分 三 个 等 级 : 全 局 (global)、 
局 部 (local) 和 外 部 Cnonlocal )。 

在 Python 中 ， 变 量 作用 域 的 查找 优先 级 为 : 局 部 、 外 部 、 全 局 和 内 建 。 其 中 内 建 变量 
是 由 Python 定义 的 以 双 下 画 线 € ) 开始 和 结束 的 变量 ， 通 常用 作 特殊 用 途 ， 如 本 书 前 面 
提 及 的 _doc 和 name _ 等。 用户 在 定义 变量 时 应 该 避免 内 建 变量 的 命名 风格 。 

Python 中 不 要 求 变 量 强制 声明 ， 但 在 真正 使 用 变量 之 前 ， 它 必须 已 经 绑 定 到 某 个 对 象 。 
而 名 字 绑 定 将 在 当前 作用 域 中 引入 新 的 变量 ， 同 时 屏蔽 外 层 作 用 域 中 的 同名 变量 ， 不 论 这 个 
名 字 绑 定 发 生 在 当前 作用 域 中 的 哪个 位 置 。 
45.4. 全 局 变量 和 局 部 变量 

不 在 函数 内 创建 的 变量 就 是 全 局 变量 。 全 局 变量 是 一 个 模块 中 级 别 最 高 的 变量 ， 能 被 所 
有 函数 访问 ， 并 且 自 创建 开始 ， 除 非 被 删除， 否则 将 一 直 存活 到 脚本 运行 结束 。 

在 函数 内 创建 的 变量 是 局 部 变量 。 局 部 变量 仅 在 所 定义 的 函数 内 可 见 ， 并 在 调用 沙 数 时 
创建 ， 一 旦 函数 完成 ， 框 架 被 释放， 局 部 变量 就 离开 作用 域 。 

下 面 计 算 并 输出 员工 应 得 工资 (ch4-14.py)。 本 例 重 在 讲解 全 局 变量 的 用 法 ， 而 非 工 资 的 
计算 ， 所 以 将 工资 简化 为 基本 工资 + 满 勤 奖 。 

# -*- coding: utf-8 -*- 

# 全 局 变量 示例 

base=5000 # 创 建 全 局 变量 

def salary(): 
fuat=raw_input(u" 是 否 满 勒 'Y/N':"# 创 建 局 部 变量 
if fuat.upper0= ='Y': # 访 问 局 部 变量 
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return base+2000 # 访 问 全 局 变量 
else: 
return base # 访 问 全 局 变量 
def ps(): 
ys-salary() # 创 建 局 部 变量 
printu 你 的 工资 为 ' ,ys, # 访 问 局 部 变量 
print u' 包 括 基本 工资 ',base,' 元 和 满 勤 奖 ',ys-base # 访 问 全 局 变量 并 和 局 部 变量 进行 运算 
psQ 
调用 函数 ， 运 行 结果 如 下 : 
是 否 满 勤 'Y/N':Y 
你 的 工资 为 7000 包括 基本 工资 5000 元 和 满 勤 奖 2000 
>>> ps() 
是 否 满 勤 'Y/N':N 
你 的 工资 为 5000 包括 基本 工资 5000 元 和 满 勤 奖 0 
本 例 中 的 base 为 全 局 变量 ， 在 函数 salary 和 ps 中 均 对 其 进行 了 引用 。 
4.5.2 global 语句 
函数 可 以 正常 访问 全 局 变量 ， 但 是 如 果 函 数 体内 对 全 局 变量 重新 赋值 ， 那 么 Python 会 


认为 创建 了 同 
以 函数 内 该 同名 的 局 部 变量 将 
FHER 


名 的 局 部 变量 ， 


全 局 变量 推出 了 函数 体 。 


AE 


ZAX 


# -*- coding: utf-8 -*- 


因为 变量 作用 域 的 查找 优先 级 为 局 部 、 


外 


B. 


全 


局 和 内 建 ， 所 


， 全 局 变 


局 变量 赋值 (ch4-15.py)。 在 函数 fon0 内 对 全 局 变量 赋 新 值 
量 未 改变 ， 改 变 的 是 同名 的 局 部 变量 。 


g x-2345 # 全 局 变量 
def fun(): 
g x-6789 
print u'EEZ A] g x—,g x 
print 调用 函数 前 ， 函 数 外 g x—,g x 
fun() 
print HH RUS, AŽ g x=',g x 
运行 程序 ， 结 果 如 下 : 
调用 函数 前 ， 函 数 外 g_x= 2345 
函数 内 g_x= 6789 
调用 函数 后 ， 函 数 外 g x= 2345 
此 例 中 因为 函数 体 中 对 g x 赋值 ， 导 致 函 数 体内 创建 了 
问 的 g x 为 自己 的 局 部 变量 g x， 与 全 局 变量 g x 无关。 
如 果 想 在 函数 中 改变 全 局 变量 的 值 ， 需 要 先 在 函数 体 ! 


修改 ch4-15.py 为 ch4-16.py， 使 函数 体 中 的 g x 为 全 局 变量 


# -*- coding: utf-8 -*- 
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] global 对 全 


司 名 的 局 部 变量 g x, 


函数 中 访 


局 变量 进行 声明 。 


E g Xx。 代码 如 下 : 


gir 


g x-2345 # 全 局 变 
def fun(): 
global g x 
g x-6789 
print PEZ g x—.g x 
数 前 ， 函 数 外 g x=',g x 


ES 


print u 调 用 

fun() 

printu' 调 用 函数 后 ， 函 数 外 g_x=",g_Xx 
运行 程序 ， 结 果 如 下 : 


MHZ, Kh g x= 2345 
函数 内 g_x= 6789 
调用 函数 后 ， 函 数 外 g x= 6789 


| 结果 可 见 ， 函 数 修改 的 是 全 局 变量 e x， 调 用 函数 后 ， 全 局 变量 g x 的 值 被 修改 。 


4.53 ” 闭 包 与 外 部 作用 域 
在 4.4.3 小 节 中 介绍 了 内 部 函数 ， 在 43 节 讲 解 装饰 器 时 也 用 到 了 内 部 函数 。 自 Python 
22 AR, RAR NRO 函数 对 其 外 部 函数 的 局 部 变量 进行 访问 。 定 义 在 外 部 函数 内 但 
被 内 部 函数 引用 或 使 用 的 变量 称 为 自由 变量 。 如 果 一 个 内 部 函数 对 外 部 作用 域 的 自由 变量 进 
行 了 引用 或 使 用 ， 那 么 这 个 内 部 函数 就 称 为 闭 包 。 
闭 包 将 内 部 函数 的 代码 和 作用 域 与 外 部 函数 的 作用 域 结合 起 来 ， 其 对 维护 函数 内 变量 安 
全 和 在 函数 对 象 及 作用 域 中 随意 切换 是 很 有 用 的 。 
下 面 利 用 闭 包 表达 一 元 二 次 曲线 ax*+bxtc(ch4-17.py)。 本 例 利 用 外 部 函数 传 入 一 元 二 次 
曲线 的 三 个 系数 ， 通 过 内 部 函数 返回 一 元 二 次 曲线 。 


# -*- coding: utf-8 -*- 
def curve(a,b,c): 

def cur(x): 

return a*x*x+b*x+c 

return cur 
curvel-curve(2,1,1) # 求 具体 a、b、c 所 对 应 的 曲线 
print[(x,curvel(x)) for x in range(5)]# 利 用 列表 解析 求 曲线 ax^2+bxtc 的 多 个 坐标 值 
x=input(u' 请 输入 x 的 值 : ) 
print (x,curvel(x)) # 根 据 用 户 输入 的 x 值 ， 求 所 对 应 坐标 值 


运行 程序 ， 输 入 数据 ， 结 果 如 下 : 
[(0, D, (1, 4), (2, 11), G, 22), (4, 37)] 

请 输入 x 的 值 : 6 
(6, 79) 
代码 ch4-17.py 中 的 函数 cur 与 外 部 变量 a、b、c 形成 了 闭 包 。 利 用 闭 包 可 以 轻松 地 表达 
任意 系数 的 一 元 二 次 曲线 ， 进 而 求 出 曲线 上 的 任意 坐标 点 。 如 果 不 利用 闭 包 ， 每 次 创建 一 元 
二 次 曲线 函数 的 时 候 需 要 同时 说 明 a、b、c、x， 也 就 需要 更 多 的 参数 传递 ， 降 低 了 代码 的 可 
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移植 性 。 闭 包 能 


4.6 递归 


如 果 一 个 函数 ] 


效 减少 函数 定义 时 所 需 的 参数 数目 ， 有 利于 提高 函数 的 可 移植 性 ， 是 函数 
式 编 程 的 重要 的 语法 结构 。 


直接 或 间接 调用 了 自己 ,为 
下 面 (ch4-18.py〉 利 用 递归 函数 求 阶乘 。 本 例 


0 或 1 就 返回 


1, UH 


次 调 有 


# -*- coding: utf-8 -*- 


def fac(n): 


if n- -0 or n==1: 


else: 


>>> fac(5) 
120 

>>> fac(10) 
3628800 
>>> fac(0) 
1 


4.7 生成 器 


生成 器 就 是 一 个 带 yield 语句 的 函数 。 生 成 虽 
返回 一 个 值 (没有 return 语句 的 
间 结 果 (yield 语句 的 作用 )， 当 调用 生成 器 的 next 方法 时 


4^? 


执行 。 


return 1 


return n*fac(n-1) 


调用 函数 ， 运 行 结果 如 下 : 


下 面 是 一 个 简单 的 生成 器 实 


# -*- coding: utf-8 -*- 


# 生 成 器 示例 


def gen(): 
i-1 


yield (u' 第 96d 次 返 


i=i+1 


yield (w' 第 %d 次 返 世 


i=i+1 


yield (u' 2 


H 


% D 


% i) 


A 


&osd 次 返回 


% i) 


对 生成 器 函数 进行 调用 ， 结 果 如 下 ; 
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函数 ， 默 认 返 


H PACK n-1 的 阶乘 。 


FP 利 月 


u E; 36m 


加 None), 


侈 (ch4-19.py)。 


FJ Hi A 


8 么 这 个 函数 就 是 递归 函数 。 
日 证 语句 对 参数 n 进行 判断 ， 如 果 为 


函数 的 区 别 是 : 普通 函数 调用 一 次 
而 生成 器 能 暂停 执行 并 返回 一 个 中 


生成 器 会 从 刚才 暂停 的 位 置 继续 


ES 
EN 
E 
Es 
Sk 
dy 
Es 
ye 
中 
ES 
p 


>>> g-genÜ 

>>> print g.next() 
第 1 次 返回 
>>> print g.next() 
第 2 次 返回 
>>> print g.next() 
第 3 次 返回 
>>> print g.next() 


Traceback (most recent call last): 
File "<pyshell#28>", line 1, in «module 
print g.next() 
StopIteration 


因为 生成 器 gen0 中 有 3 条 yield 语句 ， 所 以 可 以 3 次 调用 生成 器 gen 的 next 方法 ， 然 后 
函数 就 结束 了 。 如 果 这 时 再 调用 next 方法 就 会 触发 StopIteration 异常 。 

注意 : 在 Python 3.x 中 ， 上 面 的 调用 语句 print g.next()， 需 更 改 为 print(g._ next 0). 
因为 Python 中 for 语句 可 以 自动 调用 next 方法 并 处 理 StopIteration 异常 ， 所 以 通常 使 用 
for i&fJifidE-F- AVES. Ul: 


>>> for eachi in gen(): 
print eachi 


ng 
B S 
El zl mg] 


nr NE MUT 


du 


pun 
Uo N 


在 Python 2.5 中 对 生成 器 的 特性 进行 了 加 强 ， 生 成 器 不 仅 可 以 用 next 方法 来 获取 下 一 个 
生成 的 值 ， 而 且 可 以 用 send 方法 传送 新 值 ， 使 用 throw 方法 抛 出 异常 ， 以 及 使 用 close 方法 
结束 生成 器 。 

生成 器 新 特性 示例 如 下 (ch4-20.py)。 


ny 


# -*- coding: utf-8 -*- 
# 生 成 器 示例 
def gen(): 
二 0 
while True: 
m-(yield i) 
if m is not None: 
i=m 
else: 
i=i+1 


使 用 生成 器 ， 并 调用 各 种 方法 ， 示 例如 下 : 


>>> y-genÜ 
>>> y.next() 
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0 

>>> y.next() 

1 

>>> ysend(8) # 传 送 新 的 值 给 生成 器 

8 

>>> y.next() 

9 

>>> ythrow(ValueError("hei，throw error")) JH] throw jD 


Cis 
8 
A 


Traceback (most recent call last): 
File "<pyshell#92>", line 1, in «module 
y.throw(ValueError("hei, throw error")) 
File "E:/python/ch4/ 源 代码 /4-20.py", line 6, in gen 
m-(yield i) 
ValueError: hei, throw error 
>>> y.close() # 利 用 close 结束 生成 器 
>>> ynext() ， # 结 束 后 再 调用 next 方法 ， 触 发 StopIteration 异常 


Traceback (most recent call last): 
File "<pyshell#94>", line 1, in «module 


y.next() 
Stoplteration 


48 高 级 话题 : Wipy 


SciPy 是 一 个 开源 的 Python 算法 库 和 数学 工具 包 。SciPy 在 NumPy 的 基础 上 增加 了 许多 
科学 计算 的 库 函 数 ， 包 含 用 于 各 种 科学 计算 的 工具 箱 ， 如 插值 、 信 和 号 处 理 、 优 化 、 线 性 代数 
和 统计 等 ， 满 足 大 部 分 科学 计算 的 需求 。 在 Python 中 进行 科学 计算 时 可 以 利用 SciPy 的 相关 
函数 来 完成 ， 这 些 函数 都 经 过 优化 和 严格 测试 ， 稳 健 并 且 高 效 。 

SciPy 已 经 包含 在 Anaconda 中 ， 无 需 单独 安装 。 

SciPy 涉及 领域 众多 ， 本 书 不 能 一 一 介绍 ， 具 能 挑 几 个 作为 SciPy 的 入 门 介绍 ， 如 果 读 者 
想 使 用 SciPy 完成 某 项 科学 、 工 程 计算 ， 可 选择 SciPy 的 相应 子 模块 ， 相 关 知 识 可 参见 SciPy 


d 


吉方 网 站 http:/wwwscipyorg/ 上 的 文档 。SciPy 中 包含 的 子 模块 见 表 4-1。 


表 4-1 Scipy 子 模块 


f 模 块 功能 描述 
Cluster 聚 类 算法 
Constants 均 理 和 数学 常量 
Fftpack 埔里 叶 变 换 
Integrate 积分 和 常 微分 方程 求解 
interpolate fife 
io 输入 和 输出 
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( 续 ) 
子 模 块 功能 描述 
linalg 线性 代数 
ndimage N 维 图 像 处 理 
odr 正 交 距离 回归 
optimize 优化 与 求 根 
signal 信号 处 理 
sparse Mii RE 
spatial 空间 数据 结构 和 算法 
special 和 寺 殊 函数 
stats 统计 
weave C/C++ 整合 


48.1 MEHAK 


傅立叶 变换 是 数字 信和 号 处 理 领 域 一 种 很 重要 的 算法 。 信 和 号 通过 傅 里 叶 变 换 都 可 以 表示 为 
正弦 信号 的 线性 欠 加 的 形式 ， 而 正弦 信号 是 相对 简单 并 被 充分 研究 的 信号 ， 所 以 傅 里 叶 变 换 
在 物理 、 数 学 、 信 号 处 理 、 统 计 、 密 码 学 等 领域 都 有 着 广泛 的 应 用 。 
能 够 用 计算 机 进行 处 理 的 是 离散 传 里 叶 变 换 ， 长 度 为 N 的 离散 信号 x[n] 的 离散 傅 里 叶 变 
换 ffk] 定 义 如 下 : 


/= De Ns] 


相应 的 傅 里 时 反 变换 定义 如 下 ; 
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kn 
"ex. "rd 


下 面 利用 SciPy 求 信 号 的 频谱 (ch4-21.py)， 时 域 图 像 如 图 4-2 所 示 ， 频 域 图像 如 图 4-3 
所 示 。 


fly Figure. E - [Ere 
TIET TI 


^ AAAA 
ANM 


a 


I | | 
à 4 i h 


图 4-2 ”时 域 图 
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4) WT: 导入 SciPy 的 Fftpack 子 模块 对 x[n] 进 行 傅 里 叶 变 换 ， 求 取 其 频谱 信息 。 


# -*- coding: cp936 -*- 
# 导 入 NumPy 模块 
import numpy as np 
# 导 入 scipy 模块 中 的 fftpack 子 模块 
from scipy import fftpack 

# 设 置 采样 点 个 数 

N=1000 
# 设 置 采样 时 间 间 隔 
t-1.0/200 
# 根 据 采样 间隔 和 采样 个 数 产生 序列 x 

x-np.linspace(0.0,N*t, N) 

# 通 过 函数 计算 得 到 序列 y 
y-6*np.sin(2*np.pi*x)*0.2*np.cos(100*np.pi*x)*0.03*np.sin(120*np.pi*x) 
# 导 入 Matplotlib 的 pyplot 子 库 用 于 绘图 
import matplotlib.pyplot as plt 

# 创 建 图 表 1 

plt.figure(1) 

# 显 示 时 域 图 像 

plt.plot(x,y) 

# 对 时 域 信号 进行 傅 里 叶 变换 ， 求 得 频 域 信号 
yf-fftpack.ffi(y) 
# 设 置 频 域 信 号 的 显示 区 间 和 时 间 间 隔 
xf-np.linspace(0.0,1.0/(2.0*t),N/2) 

# 创 建 图 表 2 

plt.figure(2) 

# 显 示 频 域 图 像 
plt.plot(xf,2.0/N*np.abs(yf[0:N/2])) 

# 显 示 图 表 1、2 

plt.show() 
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频 域 图 可 以 看 到 信号 主要 | 
号 强度 尤为 突出 ， 其 他 


1Hz、50Hz 和 60Hz 三 个 频率 的 信号 组 成 ， 
两 个 频率 的 信号 相对 较 弱 。 在 实际 科学 研究 和 工业 生产 中 ， 
弱 ， 如 果 认 为 该 信号 中 频率 为 1Hz 的 信 


第 4 章 函数 与 函数 式 编程 
其 中 1Hz 的 信 
获取 的 信 


] SciPy 的 signal 子 模块 设计 滤 


陷 波 滤波 器 滤 除 噪声 ， 但 实际 科学 研究 和 生产 


声 来 源 复 杂 、 随 机 性 强 。 因 此 


号 通常 混杂 了 噪声 ， 而 噪声 的 强度 通常 相对 主 信号 但 
号 为 主 信 号 ， 频 率 为 50Hz 和 60Hz 的 信号 为 噪声 ， 则 可 以 利 
波 器 滤 除 噪声 。 
48.2 ”滤波 

如 果 知 道具 体 的 噪声 频率 ， 则 可 以 设计 
中 ， 往 往 知道 有 用 信和 号 的 频率 ， 而 不 知道 噪声 的 频率 ， 因 为 噪 
常常 需要 设计 带 通 滤波 器 ， 保 证 有 用 信和 号 的 通过 ， 同 时 滤 除 噪声 。 


(1) 设计 滤波 器 


在 SciPy 的 signal 子 模块 中 ， 设 计 带 通 滤波 器 可 以 使 用 函数 iirdesign， 其 格式 如 下 : 


lirdesign(wp, ws, gpass, gstop, analog=False, ftype='ellip', output-'ba") 


各 参数 意义 如 下 : 

ws: 阻 带 边 缘 频 率 。 

gpass: 通 带 最 大 增益 (dB), 
gstorp: 阻 带 最 小 衰减 (dB )。 
analog: 参数 值 


为 True， 则 返回 一 个 模拟 滤波 器 ;参数 值 为 False， 则 返回 


一 个 数字 滤波 器 。 


ftype: 字符 串 类 型 参数 ， 表 示 滤 波 器 类 型 ， 详 见 表 4-2。 
表 4-2 ftype 参数 

滤波 器 类 型 ftype 参数 值 

Butterworth "butter' 

Chebyshev I 'cheby1' 

Chebyshev II 'cheby2' 

Cauer/elliptic 'ellip' 

Bessel/Thomson 'bessel' 

output: 字符 串 类 型 参数 ， 表 示 输 出 类 型 ，'ba' 表 示 分 子 /分 母 型 ，'zpk' 表 示 极 点 - 零 型 
(2) 滤波 


设计 好 滤波 器 后 ， 可 调用 SciPy 的 signal 子 模块 中 的 lfilter E 
lfilter(b, a, x, axis=-1, zi-None) 


各 参数 意义 如 下 : 

b: 滤波 器 的 分 子 系数 向 量 
a: 滤波 器 的 分 母系 数 向 量 ，b 和 a 可 | 
需要 滤波 的 信号 向 量 ， 即 滤波 器 的 输 
输入 向 量 的 滤波 轴线 。 
滤波 器 延迟 初始 条 件 。 


FH 


o 


iirdesign 函数 获得 。 
JA [n] 5t 


X: 


o 


axis: 


Zi: 


函数 进行 滤波 ， 其 格式 如 下 : 
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下 面 设计 滤波 器 滤 除 上 例 中 原 信号 x[n] 中 的 高 频 信 号 ， 仪 保留 频率 为 1Hz 的 低频 信号 
(ch4-22.py)。 

分 析 : 导入 SciPy 的 signal 子 模块 ， 先 利用 iirdesign 函数 设计 滤波 器 ， 然 后 调用 lfilter 
函数 进行 滤波 。 


-*- coding: cp936 -*- 
# AX numpy 模块 
import numpy as np 
# 设 置 采样 点 个 数 
N=1000 
# 设 置 采 样 时 间 间 隔 
t-1.0/200 
# 根 据 采样 间隔 和 采样 个 数 产生 序列 x 
x-np.linspace(0.0,N*t, N) 

# 通 过 函数 计算 得 到 序列 y 

y-6*np.sin(2*np.pi*x)*0.2*np.cos(100*np.pi*x)*0.03*np.sin(120*np.pi*x) 

# 导 入 SciPy 的 signal 子 模块 

from scipy import signal 

# 设 计 低 通 滤波 器 ， 通 带 的 截止 频率 为 0.05*f0， 人 0 为 采样 频率 ， 阻 带 的 起 始 频 率 为 0.2*f0， 通 带 
的 最 大 增益 为 24B， 阻 带 的 最 小 衰减 为 10dB。 

b,a-signal.iirdesign(0.05,0.2,2,10) 

# 利 用 滤波 器 对 信号 y 进行 滤波 

z-signal.Ifilter(b,a,y) 

# A. Matplotlib 的 pyplot 子 库 用 于 绘图 

import matplotlib.pyplot as plt 

# 利 用 绿色 画 出 原 信和 号 

plt.plot(x,y,'g") 

# 利 用 红色 画 出 滤波 后 信号 

plt.plot(x,z,'1") 

# 显 示 图 表 

plt.show() 


滤波 前 后 的 信号 比较 如 图 4-4 所 示 。 


d 


图 4-4 原 信号 与 滤波 后 信号 比较 
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4È BAK RAAR 


1 图 4-4 可 以 看 到 ， 通 过 滤波 ， 滤 去 了 高 频 噪 声 ， 使 信号 变 得 光滑 ， 但 是 滤波 导致 信号 
有 一 定 程 度 的 延迟 。 


4.9 小 结 


本 章 主 要 讲述 了 在 Python 中 定义 和 调用 函数 。Python 允许 在 一 个 函数 的 定义 体 中 定义 
另 一 个 函数 ， 并 由 此 带 来 于 包 和 外 部 作用 域 的 问题 ， 与 多 数 语言 不 同 ， 需 要 读者 好 好 阅读 领 
会 。Python 允许 使 用 装饰 器 对 函数 进行 装饰 ， 这 样 读者 在 编写 函数 时 就 可 以 专注 于 功能 的 实 
现 ， 而 装饰 器 可 以 帮助 函数 实现 一 些 通用 的 功能 ， 在 函数 调用 前 运行 些 预备 代码 或 函数 调用 
后 执行 些 清理 工作 。 本 章 还 介绍 了 SciPy，SciPy 是 开源 的 Python 算法 库 和 数学 工具 包 ， 原 
来 用 MATLAB 做 科学 研究 的 人 很 容易 掌握 并 应 用 SciPy。 
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YE Python 中 ， 文 件 不 仅 包 括 普 通 意义 
层面 的 “文件 ” 如 Web 页 面 。 几 
(例如 标准 输入 / 输 


操作 。 


5.1 磁盘 文件 


Ws x 


ft 


上 的 磁盘 文件 ， 还 包括 其 他 任意 可 访问 的 抽象 


区 


H AFE 


读 写 磁盘 文 们 


要 先 用 open0 或 file) K AGT 


511 打开 、 关 闭 磁盘 文件 


1. open) KAŽI 
用 open0 函 数 打 


通常 使 
个 IOError 错误 。 
open) É 


数 的 使 用 格式 如 下 : 


zu 


(例如 read0 和 write()) 的 对 象 


文件 类 型 接口 


UAE ZX 


socket, pipes 等 )， 均 可 作为 类 文件 (file-like) 访 问 。 
本 章 的 类 文件 以 磁盘 文件 (习惯 意义 上 所 指 的 文件 ) 和 StringIO 为 例 进行 了 讲解 ， 并 介 


F 是 常见 的 IO 操作 ，1 
于 磁盘 文件 


F， 完 成 读 写 操作 后 ， 


绍 了 文件 系统 的 操作 Cos 模块 和 os.path 模块 )， 最 后 介绍 了 Python 读 写 Excel 文件 的 


于 Python 不 能 直接 操作 磁盘 文件 ， 所 以 在 读 写 前 需 
+H] close0 函 数 关 闭 文件 。 


开 磁 盘 文 件 ， 如 果 打 开 成 功 会 返回 一 个 文件 对 象 ， 否 则 会 引发 一 


文件 对 象 =open( 文 件 名 ， 访 问 模式 ="， 缓 冲 方式 =-1) 


参数 说 明 : 


(OD 文件 名 ， 为 要 打开 的 文件 名 字 的 字符 串 ， 可 以 使 用 相对 路 径 或 绝对 路 径 。 


(2) 访问 模式 ， 为 代表 文件 打 
FE， 还 可 以 用 'w'( 写 入 方式 ) Ra (追加 方式 ) 打开 文件 ， 详 见 表 5-1. 


a 


EUSEB. BUAT RERDUIBUNI HE 


的 系统 缓冲 机 制 ， 


1) 对 


(3) 缓冲 方式 ， 


UIT: 


指定 访问 文件 时 所 采 
直接 读 写 ， 仅 在 二 进 制 模式 下 有 效 。 设 置 为 1 时 ， 表 示 在 文本 模式 下 使 用 行 缓冲 区 方式 。 设 
置 为 大 于 1 时 ， 表 示 使 用 给 定 值 作为 缓 ; 


方式 ， 设 置 为 0 时 ， 表 示 不 使 用 缓冲 区 ， 


用 的 组 ; 


! 区 大 小 。 不 提供 参数 或 设置 为 负 值 ， 代 表 使 用 默认 


于 二 进 制 文件 模式 ， 采 用 
配 的 磁盘 块 来 决定 ， 如 果 获 取 系统 磁盘 块 的 大 小 失败 ， 就 使 用 内 部 常量 io.DEFAULT_ 


Ti 


区 方式 ， 内 存 块 的 大 小 根据 系统 设备 分 


定 块 内 存 缓冲 


BUFFER SIZE 定义 的 大 小 。 一 般 的 操作 系统 上 ， 块 的 大 小 是 4096B 或 8192B。 
2) 对 于 交互 的 文本 文件 (采用 isatty0 判 断 为 True) 时 ， 采 用 一 行 缓冲 区 的 方式 。 其 他 


文本 文件 使 用 与 二 进 


吓 文 件 一 样 的 方式 。 


$53 文件 


表 5-1 文件 的 访问 模式 


访问 模式 操作 说 明 
r 以 读 取 方式 打开 文件 
rU BLU 以 读 取 方式 打开 文件 ， 同 时 提供 通用 换行 符 支 持 

w 义 写 入 方式 打开 文件 

a 头 追 加 方式 打开 文件 

r+ 头 读 写 模式 打开 〈 参 见 T) 

w+ 头 读 写 模式 打开 〈 人 参见 w) 

a+ Jia aN CZ DL a) 

rb 闵 二 进 制 读 取 模 式 打开 

wb 进 制 写 入 模式 

ab - 进 制 追加 模式 

Tb+ - 进 制 读 写 模式 (参见 r+) 

wb+ - 进 制 读 写 模式 (参见 w+) 

ab 进 制 读 写 模式 (参见 a+) 

下 面 是 对 表 5-1 的 进一步 解释 。 


1) 使 用 mr、'U'、+' 或 rb+' 模 式 打开 的 文件 必须 已 经 存在 ， 否 则 会 引发 IOError 错误 。 
2) 使 用 w、'w+'、'wb' 或 "wb+' 模 式 打开 的 文件 ， 若 文件 不 存在 则 自动 创建 ， 若 存在 则 先 
清空 再 写 入 。 
3) 使 用 a'、'at'、'ab' 或 ab+' 模 式 打 开 的 文件 ， 若 文件 不 存在 则 自动 创建 ， 若 存在 ， 追 加 
的 数据 将 写 在 文件 的 末尾 ， 即 使 使 用 seek0 方 法 将 文件 指针 移动 到 别 的 位 置 ， 数 据 也 会 被 追 
加 在 文件 末尾 。 
下 面 是 打开 文件 写 入 内 容 并 读 出 的 实例 (ch5-1.py)。 
分 析 : 先 以 "w+' 模 式 打开 文件 ， 再 写 入 内 容 并 读 出 。 


# -*- coding: utf-8 -*- 
myfile-open('D:Wfrstfile.txt' "w--") 
myfile.write('my first file built by python Wn") 
myfile.write('hello,world Wn) 
myfile.seek(0,0) 
for eachline in myfile: 

print eachline, 


myfile.close() 


运行 程序 ， 结 果 如 下 : 


my first file built by python 
hello,world 


例子 中 用 到 的 write0 和 read0 函 数 将 在 5.1.2 和 5.1.3 小 节 中 介 
文件 指针 移 至 文件 开头 ，seekO 函 数 将 在 5.1.4 小 节 介 绍 。 
open0 函 数 中 的 路 径 分 割 线 使 用 了 双 反 和 斜 线 ， 这 是 因为 在 Python 的 转 义 字符 中 用 双 反 和 斜 


MR 


。myfile.seek(0,0) 语 句 将 
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Zk QUO 表示 单反 斜 线 (\)。 也 可 以 在 文件 名 字符 串 前 加 字母 “r”， 表 示 这 是 “ 源 ” 字 符 串 ， 
相应 的 路 径 分 割 线 使 用 单反 和 斜 线 即 可 ， 即 open(r'D:Mirstfile.txt',w-). SERE, Python 中 的 
openO 函 数 接受 由 斜 线 字 符 OO. 分 隔 开 的 目录 和 文件 名 构成 的 文件 路 径 ， 而 完全 不 必 考 虑 操 
作 系 统 。 所 以 本 例 中 的 open0) 函 数 也 可 写 为 : open(D:/firstfile.txt,w+)。 

2. file) E Zt 
Python 2.2 以 来 ， 文 件 对 象 有 了 对 应 的 内 建 函 数 file0。 与 openQ eA Zip IR], file) ER Zt 
可 以 打开 文件 并 创建 文件 对 象 的 实例 。 凡 是 使 用 open0 函 数 完 成 的 功能 均 可 用 file0 函 数 代 
替 ， 但 是 建议 在 打开 文件 进行 操作 时 ， 使 用 open0O 函 数 ， 而 在 处 理 文 件 对 象 时 使 用 file0 
函数 。 

3. close0 函 数 

完成 文件 读 写 操作 后 要 使 用 close0 函 数 关闭 文件 。 虽 然 Python 的 垃圾 回收 机 制 会 在 文 
件 对 象 的 引用 计数 降 为 零 时 ， 自 动 关闭 文件 ， 但 及 时 使 用 close0 函 数 关 闭 文件 ， 能 够 避免 丢 
失 绥 冲 区 的 数据 。 通 常 上 只 有 缓冲 区 满 时 ， 数 据 才 被 读 入 程序 或 写 入 和 磁盘， 而 close0 函 数 被 调 
用 时 ， 无 论 缓 冲 区 是 否 满 ， 数 据 都 会 被 及 时 处 理 。 

4. with 语句 

在 文件 读 写 中 有 可 能 产生 IOError 错误 ， 一 旦 出 错 ， 后 面 就 不 会 调用 close0 函 数 ， 文 件 
在 很 长 时 间 内 一 直 是 打开 的 。 为 了 保证 无 论 出 错 与 否 ， 都 能 正确 关闭 文件 ，Python 引入 了 
with 语句 保证 退出 时 调用 close0 函 数 ， 例 如 ; 


c— 


with open('D:\\firstfile.txt','w') as myfile: 
myfile.write('hellown") 
myfile.write(^world' n") 


此 代码 等 价 于 : 


myfile=open('D:irstfile.txt','w') 
try: 

myfile.write('hello\n') 

myfile.write(‘world\n') 
finally: 

myfile.close() 


try-finally 语句 经 常用 来 保证 无 论 是 否 发 生 异 常 ， 某 段 代 码 一 定 会 被 执行 (finally 后 的 
代码 )。 
5.1.2 写 文 件 


1. write0 函 数 
Python 的 内 建 函 数 write0 可 以 把 字符 串 写 到 文件 中 ， 使 用 格式 如 下 : 


文件 对 象 名 .write( 字 符 串 ) 
例如 : 


>>> myfile=open(D:Nfirstfile.txt,w) 
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>>> myfile.write('hellown") 
>>> myfile.close() 


文件 中 的 内 容 如 图 5-1 所 示 。 


P firstfile. txt - 记事 本 
XD RED 格式 (0) 查看 (Y) 帮助 他) 
hello 


图 5-1 写 入 后 文本 内 容 


2. writelines0 AŽ% 


writelinesO 函 数 能 将 字符 串 列 表 一 次 性 写 入 文件 ， 使 用 格式 如 下 : 
文件 对 象 名 .writelines( 字 符 串 列表 ) 


writelines() 函 数 不 会 自动 在 每 个 字符 串 的 后 面 加 入 行 结束 符 ， 所 以 如 果 需 要 的 话 ， 应 该 
在 调用 writelines() 函 数 前 为 每 个 字符 串 的 末尾 加 上 行 结束 符 。 
下 面 将 列表 内 容 一 次 性 写 入 文件 中 (ch5-2.py)。 
分 析 : 以 "w 方 式 打开 文件 ， 然 后 调用 writelinesO 函 数 将 字符 串 列表 写 入 文件 。 
代码 ， 
# -*- coding: utf-8 -*- 
HET S I PU 
listhh=[' 天 路 ,天 亮 了 ,青春 , 那 片 海 " 美 丽 的 神话 ,谈何容易 ] 
listfile-open( listfile.txt',w") 
listfile.writelines(listhh) 
listfile.close() 


运行 程序 后 ， 文 件 “listfile.txt” 中 的 内 容 如 图 5-2 所 示 。 


P 1istfile. txt - 记事 本 
文件 正 ) 编辑 人 E) 格式 (0) 查看 (Y) 帮助 (H) 
天 路 天 亮 了 青春 邦 片 海 美丽 的 神话 谈 何 容 吻 


图 5-2 文件 “listfile.txt” 中 的 内 容 


由 图 5-2 可 见 ，writelines0 函 数 虽 将 字符 串 列表 中 的 所 有 项 均 写 入 了 文件 ， 但 并 没有 自 
动 换行 ， 如 果 想 每 一 项 占 一 行 ， 可 将 列表 listhh KELKA listh RK, KET n, 
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春 \n',' 那 片 海 \n',' 美 丽 的 神话 \nm',' 谈 何 容易 \n'] 后 ， 再 运行 程序 ， 文 件 “listfile.txt” 中 的 内 容 如 
图 5-3 所 示 。 
P listfile. txt - 记事 本 
美丽 的 神话 
谈何容易 
图 5-3 文件 “listfile.txt” 中 的 内 容 (一 行 一 条 ) 
如 果 字 符 串 列表 中 只 有 一 个 字符 串 ， 那 么 writelines0 函 数 的 功能 与 write0 函 数 的 功能 类 


似 ， 将 这 一 个 字符 串 写 入 文件 。 
5.1.3 ix XML 
1. read0 函 数 


read() 函 数 用 于 从 文件 中 读 取 字 节 到 字符 串 中 ， 使 用 格式 如 下 : 
read([size]) 


read0 函 数 的 返回 值 为 字符 串 ， 如 果 给 定 size 23H. size>0， 则 最 多 读 取 size 
如 果 size 参数 缺 省 〈 默 认为 -1)， 或 size<0， 则 将 一 直 读 取 到 文件 末尾 。 
例如 : 


>>> listfile=open('d:\\firstfile.txt','r') 
>>> print listfile.read() 

hello 

>>> listfile.seek(0,0) 

>>> print listfile.read(2) 

he 

>>> listfile-open( listfile.txt',r") 
>>> print listfile.read() 


天 路 


>>> listfile.close() 


2. readline0 和 readlines() E 2T 
readline0 函 数 用 于 读 取 一 行 ， 包 含 行 结束 符 。readlinesO 函 数 用 于 读 取 所 有 行 ， 
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返回 值 为 


$53 文件 
一 个 字符 串 列 表 。 
readlineO) 函 数 的 使 用 格式 如 下 : 


readline([size]) 
读 取 下 一 行 ， 其 中 可 选 参数 size 代表 读 取 的 最 多 字 节 数 ， 默 认为 -1， 表 示 读 至 行 结束 符 。 如 
果 给 定 size<0， 则 读 至 行 结束 符 ， 如 果 size>0, H. size 小 于 下 一 行 字 节 数 ， 则 读 取 size 个 字 
节 ， 可 能 是 不 完整 行 。 如 果 size>0, H. size 大 于 下 一 行 字 节 数 ， 则 读 取 下 一 行 ， 包 括 行 结 
束 符 。 
readlines( 〇 函数 的 使 用 格式 如 下 : 


readlines([size]) 


读 取 剩 下 所 有 行 ， 并 作为 字符 串 列表 返回 。 参 数 size 表示 读 出 的 内 容 换算 成 的 近似 字 节 数 。 

通常 情况 下 ，Python 会 自动 将 用 户 指定 的 size 的 值 调整 成 内 部 缓存 大 小 的 整数 倍 。 参 数 

size 在 处 理 大 型 数据 文件 《文件 大 小 与 计算 机 内 存 相当 或 更 大 ) 时 ， 比 较 有 实用 价值 。 
例如 : 


>>> f-open('dMfirstfile.txt','r") 
>>> yu=f.readlines() 
>>> for eachline in yu: 
print eachline 
>>> f.close() 


输出 结果 为 : 


hello 


world 


hello 和 world 间 有 两 次 换行 ， 这 是 因为 读 出 的 行 字 符 串 中 本 身 带 有 行 结束 符 ， 而 print 
语句 后 没有 “, ”也 自动 换行 导致 的 。 如 果 将 for 循环 改写 为 : 


>>> for eachline in yu: 


print eachline, 
则 输出 结果 为 : 


hello 
world 


3. 文件 迭代 
Python 2.2 以 来 ，Python 引入 了 和 迭代 器 和 文件 和 迭代， 文件 对 象 成 了 自己 的 迭代 器 ， 程 


序 员 不 需要 调用 read0、readline0 或 readlines0) 函 数 就 可 以 访问 到 文件 中 的 每 一 行 数据 。for 
循环 会 自动 调用 file.next0 方 法 来 读 取 下 一 行 ， 并 在 所 有 行 结束 后 ， 捕 获 Stoplteration 异常 ， 
停止 循环 。 
前 面 readlinesO 函 数 的 例子 ， 完 全 可 以 不 使 用 readlines0 函 数 ， 而 直接 使 用 文件 迭代 ， 更 


pa 


= 
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简洁 ， 更 直观 。 如 : 


5.1.4 


" 


其 


>>> f-open('dMfirstfile.txt','r) 


>>> for eachline in f: 


print eachline, 


>>> fc 


lose() 


输出 结果 为 : 


hello 
world 


] 于 检测 文人 


文件 指针 操作 
Python 的 内 建 函 数 seek() 用 于 移动 文人 


F 指 针 的 位 置 。seek() 函 数 的 使 用 格式 为 : 


seek( fh 


移 量 [， 相 对 位 置 ]) 


指针 《〈 读 / 写 位置 指 针 ) 到 不 同 的 位 置 ，tellO 函 


中 偏 移 量 的 单位 为 字 节 ， 相 对 位 置 为 可 选 参数 ， 默 认 值 为 0， 表 示 从 文件 开头 算 起 ， 如 果 


相对 位 置 设 为 1， 表示 从 当前 位 置 算 起 ， 设 为 2， 表 示 从 文件 末尾 算 起 。 
tell0 函 数 的 使 用 格式 很 简单 ， 为 : 


tell() 


例 : 


>>> f=open('newfile.txt','w+') 
>>> print f.tell() 


0 


>>> f.write('the first linen") 
>>> print f.tell() 


16 


>>> f.write('the second linen") 
>>> print f.tell() 


33 


>>> f.seek(-17,1) 
>>> print f.read() 


the second line 


>>> fc 


lose() 


9.2 StringI0 类 文件 


在 第 1 章 提 及 Python 是 “鸭子 类 型 ”(duck typing) 的 语言 。Python 的 文件 是 典型 的 鸭 


子 类 型 : 文人 


F 处 理 接口 不 仅 能 处 理 磁盘 文件 ， 其 中 的 处 理 函 数 还 可 用 于 与 文件 对 象 类 似 的 对 


$$. (E Python F, ÆRET 5.1 节 中 介绍 的 read0 或 者 write0 这 7 
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而 个 面向 文件 操作 函数 的 


^A E 
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对 象 被 统称 为 类 文件 对 象 file-like Object). ËR T 5.1 节 介 绍 的 file 对 象 ， 还 可 以 是 内 存 的 字 


we 


节 流 、 网 络 流 、 自 定义 流 等 。Python 的 标准 库 ， 
Sys.stdout. sys.stderr. urllib. socket. StringlO. 


非常 多 的 类 文件 ， 例 如 sys.stdin、 


sys.stdin 〈 标 准 输入 ) 为 解释 器 提供 输入 字符 流 。sys.stdout〈 标 准 输出 ) 接收 print 语句 


的 输出 。sys.stderr《〈 标 准 错误 ) 接收 出 错 信 ， 
和 stderr 产生 屏幕 输出 。 一 般 情 况 下 ， 程 


i. stdin 通常 被 映射 到 用 户 键盘 输入 ;， 而 stdout 
序 运 行 时 ， 三 个 标准 文件 stdin, stdout 和 stderr 可 


以 直接 访问 ， 因 为 系统 会 自动 打开 这 三 个 文件 。 
sys.stdout, sys.stderr 来 访问 这 三 个 标准 文件 了 。 
StringIO 就 是 在 内 存 中 创建 的 file-like Object， 常 月 


时 作 临 时 缓冲 。 换 言 之 ， 


导入 sys 模块 后 ， 就 可 以 使 用 


sys.stdin、 


StringIO 能 将 


内 存 数据 当成 文件 来 操作 。 可 通过 StringIO 的 类 文件 特性 ， 将 Matplotlib 用 于 Web 环境 中 
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所 调整 ， 


(例如 Flask, Django 等 )。 但 需要 注意 的 是 StringIO 在 Python 3 ! 
StringIO 类 文件 给 出 了 Python 2 与 Python 3 的 区 别 。 
1. 创建 StringIO 类 文件 


构造 函数 StringIO0 用 于 创建 StringIO 类 文件 。 可 以 在 构造 类 文件 时 传 


StringIO0 函 数 ， 创 建 有 内 容 的 StringIO 类 文件 ， 如 果 没 有 字符 串 ，StringIO00 函 
StringIO 类 文件 。 
例如 : 


>>> import StringIO as sio 
>>> f-sio.StringlIO() 
>>> ff-sio.StringIO("StingIO example") 


而 Python 3 将 StringIO 放 在 io 模块 中 ， 所 以 上 述 代码 需 改 为 下 面 写法 : 


>>> from io import StringIO 

>>> f-StringlO() 

>>> f-StringlO("StringIO example") 
2f 

< jo.StringlIO object at Ox01F69CBO> 


2. i€& 5 StringIO 类 文件 


读 写 StringIO 类 文件 与 读 写 普 通 磁 盘 文 件 类 似 ，StringIO 类 文件 也 支持 5. 


read(). readline(). readlines(). write(). writelines() 5: KZ. 


例如 : 


>>> import StringIO as sio 

>>> ff-sio.StringIO() 

>>># 写 入 一 行 

>>> ff.write('have a nice day\n') 

>>># 写 入 多 行 

>>> ff.writelines([ Well begun is half done.\n','Every beginning is hard.n']) 
>>># 在 文件 末尾 读 出 
>>> ff.read() 


" 


Ar h 


空 字符 串 


在 下 面 的 创建 


c» Wr 


字符 串 给 
数 将 构造 空 的 


到 的 


ELT 
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>>># 回 到 文件 开头 


>>> ff.seek(0,0) 
>>># 读 出 文件 所 有 内 容 
>>> ff.read() 


'have a nice day\n Well begun is half done.\nEvery beginning is hard.n' 
>>># 在 文件 末尾 读 出 空 字符 中 
>>> ff.readline() 

>>># 回 到 文件 开头 

>>> ff.seek(0,0) 

>>># 读 出 第 一 行 

>>> ff.readline() 

'have a nice day\n' 

>>># 读 出 剩余 行 ， 并 显示 
>>> for eachline in ff.readlines(): 


print eachline, 


Well begun is half done. 
Every beginning is hard. 


从 上 面 例子 可 以 看 到 ，read() 函 数 虽 然 能 读 出 文件 的 全 部 内 容 ， 但 前 提 是 执行 read PA Zt 
时 ， 文 件 指 针 位 于 文件 头 ， 如 果 处 在 文件 尾 ， 则 读 出 空 字 符 串 。 为 了 便于 获取 内 存 文件 的 内 
容 ，StringIO 提供 了 getvalueO 函 数 。 

例如 : 


>>> ff-sio.StringIO() 

>>> ff.write("getvalue example") 
>>> ff.getvalue() 

'getvalue example\n' 


显然 ， 使 用 getvalue0 函 数 ， 不 需要 先 将 文件 指针 移 至 文件 头 再 读 取 文件 的 内 容 。 

3. 使 用 StringIO 模块 捕获 输出 

通常 ， 输 出 是 默认 输出 到 显示 器 ， 但 是 通过 修改 标准 文件 sys.stdout， 可 以 将 标准 输出 改 

为 输出 到 内 存 。 
下 面 的 例子 是 检查 需要 输出 的 内 容 ， 将 Computer 一 词 替 换 成 Python (ch5-3.py)。 
分 析 : 将 print 输出 的 内 容 先 输入 到 内 存 ， 检 碍 并 蔡 换 后 再 输出 到 显示 器 。 


# -*- coding: utf-8 -*- 
import sys 


import StringIO as sio 
f-sio.StringIO() 
stdout-sys.stdout 
sys.stdout-f 

print 'matlab' 

print 'C++' 
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print 'Computer' 

print 'Java' 
str£-f.getvalue().replace('Computer'," Python") 
sys.stdout-stdout 

print u 原 始 输出 ' 
print f.getvalue() 
print u EF dn dp 
print strf 

f.close() 


运行 程序 ， 输 出 结果 如 下 : 


原始 输出 
matlab 
C++ 


Computer 
Java 


SU d d 
matlab 

C++ 

Python 


Java 


下 面 以 一 个 自 定 义 的 类 文件 、StringIO 、 磁 盘 文 件 三 种 类 型 说 明 各 自用 法 与 区 别 (ch5- 
4.py)。 其 中 MyFileLike 为 自 定 义 的 类 文件 对 象 ， 定 义 了 read0 和 write0 函 数 。myfileoper FK 
数 通 过 确定 参数 类 型 ， 判 断 类 文件 类 型 ， 如 果 参 数 为 字符 串 则 为 代表 磁盘 文件 ， 需 要 通过 
open 函数 打开 ;和 否则 认为 参数 本 身 为 类 文件 对 象 实例 ， 并 在 myfileoper 函数 内 部 调用 write 
函数 ， 而 不 关心 参数 本 身 是 何 种 类 型 的 类 文件 对 象 。 在 主 函 数 中 ， 调 用 了 类 文件 对 象 的 read 
函数 。 该 程序 的 运行 结果 是 ch5-4 py 源 代码 本 身 以 及 testStringIO 的 参数 信息 。 


T 


ff! /usr/bin/python 

# -*- coding: utf-8 -*- 
import StringIO 

class MyFileLike(object): 


m 


自 定义 一 个 类 文件 (file-like ) 


" 


def init (self): 
self. container-"" 

def write(self, content): 
self. container += content 

def read(self): 
return self. container 

def myfileoper(infile, outfile ): 
以 任意 的 类 文件 对 象 为 参数 ; 
如 果 参 数 是 字符 串 ， 需 要 通过 open 函数 打开 类 对 象 。 
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if type(infile)- =str: 


 infile-open(infile) 


else : 
 infile-infile 


if type(outfile) = —str: 


. outfile-open(outfile,"w") 


else : 
 outfile-outfile 
for i in infile: 
_outfile.write(i) 
return 


if name ==" main " 


 myfilelike- MyFileLike() 

myfileoper( file ,myfilelike)## 读 取 本 文件 ， 写 入 到 自 定义 的 类 文件 中 
print myfilelike.read() 

testStringIO-StringIO.StringlIO() 

testStringIO.write("nhello test StringIo n") 


testStringIO.seek(0) 


myfileoper(testStringIO, myfilelike) 


testStringIO.close() 


print — myfilelike.read() 


53 文件 系统 操作 


在 文件 的 操作 中 ， 读 写 经 常 被 用 到 ， 但 是 有 时 程序 开发 还 需要 用 到 其 他 操作 系统 功能 ， 


如 : 删除 文件 、 重 命名 文件 、 创 建 目录 、 删 除 目 录 、 遍 历 目录 树 、 管 理 文件 访问 权限 和 管理 


文件 路 径 等 。Python 中 的 os 模块 和 os.path 模块 可 以 帮助 程序 员 完 成 这 些 操作 。 


5.3.1 os 模块 


Python 内 置 的 os 模块 提供 


装 了 不 同 操作 系统 的 通用 接口 ， 


了 Python 访问 操作 系统 功能 的 主要 接口 。 其 实 os 模块 只 是 包 
使 用 户 可 以 使 用 相同 的 函数 接口 ， 操 作 不 同 的 操作 系统 ， 并 
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返回 相同 结构 的 结果 。 不 同 的 操作 系统 ， 真 正 加 载 的 模块 不 同 ， 如 Windows 系统 对 应 的 是 
nt, UNIX/Linux 系统 对 应 的 是 posix，DOS 系统 对 应 的 是 dos 等 。 但 是 程序 员 在 编写 程序 
时 ， 不 需要 考虑 真正 加 载 的 是 哪个 模块 ， 因 为 导入 os 模块 后 ，Python 会 自动 选择 正确 的 模 
块 。 可 以 使 用 name 属性 查看 加 载 的 模块 。 


例如 : 


>>> import os 
>>> os.name 
'nt! 
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显示 模块 名 nt， 表 示 使 用 的 是 Windows 操作 系统 。 


1. os 模块 的 跨 平台 属性 


不 同 的 操 


作 系统 间 有 很 多 差异 ， 如 不 同系 统 所 支持 的 分 隔 符 不 同 : 
上 ， 行 分 隔 符 是 “mn” 在 DOS 系统 和 Windows 系统 
时 ，Python 程序 员 并 不 需要 考虑 这 些 差异 ， 因 
提供 了 相应 的 跨 平台 属性 ， 见 表 5-2。 


Hs 是 “wn”, 


为 os 模块 的 设计 者 


^A E 


$53 文件 


TE IX/Linux 系统 
和 


4 需要 进行 跨 平 台 设计 
已 经 考虑 到 这 些 问 题 ， 


M, 


表 5-2 os 模块 的 跨 平 台 属 性 


os 模块 属性 jx 
nen 行 分 隔 符 
Mad 扩展 名 分 隔 符 
sep 路 径 分 隔 符 
pathsep 多 路 径 分 隔 符 
curdir 返回 x 


当前 目录 


不 同 操作 系统 下 ，os RRP Ja 


TH2X Js Hl 


上， 如 下 : 


>>> os.linesep 
'\rin' 

>>> os.extsep 
pr 

>>> os.sep 

NO 

>>> os.pathsep 


"nt 
, 


>>> os.curdir 


11 


2. os 模块 的 文件 /目录 操作 函数 
os 模块 提供 了 很 多 文件 /目录 操作 和 权限 管理 函数 ， 


Inm 


FE 目 动 被 设 为 正确 值 


iR 


. fn, fti Windows 系统 的 


表 5-3 os 模块 的 文件 操作 函数 


remove( 文 件 名 )/unlink( 文 件 名 ) I 除 文件 

rename( 旧 文件 名 ,新 文件 名 ) 更 改 文 件 名 和 路 径 

renames( 旧 文件 名 ,新 文件 名 ) 更 改 文件 名 和 路 径 ， 如 果 路 径 中 有 不 存在 的 目录 会 自动 建立 

stat( 文 件 名 ) 返回 文件 信息 

utime( 文 件 名 ，( 访 问 时 间 ， 修 改 时 更 新 访问 和 修改 时 间 ， 如 果 ( 访 问 时 间 ， 修 改 时 间 ) 指 定 为 None， 则 用 当前 时 间 来 
间 )) 更 新 

tmpfile() 创建 并 


并 打开 一 个 新 的 临时 文件 
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表 $-4 os 模块 的 目录 操作 函数 


函数 xj 能 
chdir( H 3&) 改变 当前 工作 目录 
listdir( 目 录 ) 列 出 指定 目录 中 的 文件 
getewd() 返回 当前 工作 目录 
mkdir( 目 录 ) 创建 目录 
makedirs( 目 录 ) 与 mkdir 类 似 ， 但 可 创建 多 层 目录 
rmdir( 目 录 ) IREK 
removedirs( H 3&) | 除 多 层 目 录 
参数 “目录 ”， 指 定 要 遍历 的 目录 。 如 果 省 略 topdown 参数 ， 则 先 遍 
= E 历 目 录 下 文件 ， 再 遍历 其 子 目录 下 文件 ， 和 否则 相反 。 如 果 省 略 onerror 2 
i. 0 A 数 ， 则 忽略 遍历 文件 时 过 到 的 错误 ， 否 则 该 参数 应 为 一 个 错误 提示 的 
函数 
表 5-5 os 模块 的 权限 管理 函数 
HO 3#⁄ Xj 能 
access( 文 件 名 ， 模 式 ) 检验 文件 权限 模式 
chmod( 文 件 名 ， 模 式 ) 更 改 文件 权限 模式 
umask( 权 限 模式 ) 设置 新 权限 模式 ， 并 返回 旧 权限 模式 


T 


表 中 的 文件 名 为 带路 径 的 文件 名 ， 如 果 省 略 路 径 ， 则 表示 当前 工作 目录 下 文件 。 


>>> import os 

>>># 创 建文 件 并 写 入 内 容 

>>> f=open('d:\\we.txt','w') 

>>> f.write('helloWn") 

>>> f.close() 

>>># 显 示 文 件 信息 

>>> os.stat('d:Wwe.txt") 

nt.stat_result(st mode=33206, st ino-OL, st dev-0, st nlink-0, st uid-0, st gid-0, st size-7L, 

st atime-1427040000L, st mtime-1427096256L, st ctime-1427096236L) 

>>># 更 新 文件 访问 和 修改 时 间 

>>> os.utime('d:\\we.txt', None) 

>>># 显 示 文 件 信息 

>>> os.stat('d:Wwe.txt") 

nt.stat_result(st mode=33206, st_ino=0L, st dev-0, st_nlink=0, st uid-0, st gid-0, st size-7L, 
st atime-1427040000L, st mtime-1427096328L, st ctime-1427096236L) 


WRH rename 函数 重 命名 时 路 径 中 有 不 存在 的 目录 ， 会 引发 错误 ， 如 ; 


>>> os.rename('d:Nwe.txt' d: WPythonWwe.txt") 
Traceback (most recent call last): 

File "<stdin>", line 1, in «module» 
WindowsError: [Error 3] 


用 renames 函数 重 命 名 时 ， 如 果 路 径 中 有 不 存在 的 目录 ，renames 函数 会 自动 建立 该 目 
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录 ， 如 图 5-4 所 示 。 


>>> os.renames('d:\\we.txt','d:\\Python\\we.txt') 
>>> os.remove('d:\\Python\\we.txt') 


和 Python 


tQ) ARD SEV 收藏 (4) 工具 (T) HED 


Omis- O d Ps xh |m d X 
HEHE (D) (£3 D: Python 


文件 和 文件 夹 任务 
£9 创建 一 个 新 文件 夹 


E THETOCFOR AUS 
e 
kg 共享 此 文件 夹 


图 5-4 renames 函数 自动 建立 目录 


目录 操作 函数 示例 : 


>>> import os 
>>># 更 改 当 前 目录 

>>> os.chdir('D:NPython') 
>>># 显 示 当 前 工作 目录 
>>> os.getcwd() 
'D:NPython' 

>>># 显 示 当 前 目录 下 文件 
>>> os.listdir('.') 

['sf.txt', 'sd.txt'] 

>>># 创 建 子 目 录 

>>> os.mkdir('tyu") 
>>># 更 改 当 前 目录 

>>> os.chdir('.\tyu') 
>>># 显 示 当 前 工作 目录 
>>> os.getcwd() 
'D:\\Python\\tyu' 
>>># 创 建 多 级 子 目 录 
>>> os.makedirs('d1\d2\d3') 
>>># 更 改 当 前 目录 

>>> os.chdir('d1") 

>>># 显示 当 前 工作 目录 
>>> os.getcwd() 
'DAPythonNtyu dI" 


pi 


123 


Python Fp 4 Pp Jf] 


>>># 更 改 当 前 目录 
>>> os.chdir('d2Nd3') 


>>># 显 示 当 前 工作 


>>> os.getcwd() 


录 


'D:\\Python\\tyu\\d 1\\d2\\d3' 


>>>HMIER T TAFA 


€ d3. 


>>> os.rmdir('tyu\d 1\\d2\\d3') 
>>># 删 除 文件 夹 tyu 及 其 下 面子 文件 夹 dl 和 d2 
>>> os.removedirs('tyud1Wd2") 


>>>#)J] D:\Python 


>>> for i in os.walk('d:/python'): 


print i 


('d:/python', [], ['sf.txt', 'sd.txt']) 
>>> os.chdir('d:/python") 


>>># 创 建 子 目录 
>>> os.mkdir('we') 


>>># 设 子 目 录 为 当前 工作 目录 


>>> os.chdir('we') 
>>> os.getcwd() 
'd:NpythonWwe' 


>>># 在 目录 “we'" 下 创建 文件 fl.txt 
>>> f=open('fl.txt','w') 


>>> f.write('file one") 
>>> f.close() 


2t OS) D:\Python 目录 
>>> for i in os.walk('d:/python"): 


print i 


('d:/python', ['we'], ['sf.txt', 'sd.txt']) 
('d:/python\\we', [], ['£1.txt']) 


5.3.2. os.path 模块 


os.path 模块 提供 对 文 从 


F 路 径 操作 的 函数 ， 可 以 操作 文件 路 径 中 的 各 个 部 分 ， 如 查询 目录 


路 径 、 查 询 不 带路 径 的 文件 名 、 查 询 路 径 是 不 是 绝对 路 径 等 ， 见 表 5-6—5-8. 
os.path 路 径 分 隅 


os.path 路 径 查 询 函 数 ， 表 5-7 是 os.path 文件 信息 查询 函数 ， 表 5-8 是 


表 5-6 是 


函数 。 
表 5-6 ospath 路 径 查询 函数 
exists( 路 径 ) 查询 路 径 是 否 存在 ， 返 回 True 或 False 
isabs( 路 径 ) 查询 路 径 是 否 为 绝对 路 径 ， 返 回 True 或 False 
isdir( 路 径 ) 查询 路 径 是 不 是 已 存在 目录 ， 如 果 路 径 中 有 文件 名 ， 返 回 False 
isfile( 路 径 ) 查询 路 径 是 不 是 已 存在 文件 ， 如 果 路 径 中 没有 文件 名 ， 返 回 False 
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45-7 ospath 文件 信息 查询 函数 


Boo Xj 能 
getatime( 文 件 名 ) 查询 文件 最 近 访 问 时 间 
getctime( 文 件 名 ) 查询 文件 创建 时 间 
getmtime( 文 件 名 ) 查询 文件 最 近 修改 时 间 

getsize( 文 件 名 ) 查询 文件 大 小 (以 字 节 为 单位 ) 

表 5-8 os.path 路 径 分 隔 函 数 

函数 功能 
basename( 路 径 ) 取 路 径 中 的 文件 名 
dirname( 路 径 ) 去 掉 文 件 名 ， 取 路 径 中 的 目录 路 径 

join( 路 径 1[， 路 径 2[……]]) 将 多 个 路 径 组 合 后 返回 ， 第 一 个 绝对 路 径 之 前 的 参数 将 被 忽略 

split( 路 径 ) 返回 (目录 路 径 ， 文 件 名 ) 元 组 
splitdrive( 路 径 ) 返回 〈 盘 符 ， 不 含 盘 符 路 径 ) 元 组 
splitext( 路 径 ) 返回 《路 径 和 主 文件 名 ， 扩 展 名 ) 元 组 


假设 在 dNPython 目录 下 有 两 个 文件 : sftxt 和 sd.txt，os.path 路 径 查 询 函 数 示例 
如 下 : 


>>> import os 
>>># 显 示 当 前 工作 
>>> os.getcwd() 
'C:\Documents and Settings\Admin\My DocumentsNPython Scripts' 
>>># 更 改 当 前 工作 目录 

>>> os.chdir('d:WPython!) 

>>># 显 示 当 前 目录 下 文件 

>>> os.listdir(".' 
['sf.txt', 'sd.txt'] 
>>># 测 试 文件 是 否 存 在 
>>> os.path.exists('sf.xt") 

False 

>>> os.path.exists('sf.txt") 

True 

>>> os.path.exists('sfff.txt") 

False 

>>># 路 径 是 不 是 绝对 路 径 

>>> os.path.isabs('sf.txt") 

False 

>>> os.path.isabs('d:\\Python\\sf.txt') 
True 

>>># 测 试 是 不 是 已 存在 目录 

>>> os.path.isdir('d:NPython') 

True 


xu 


— 
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>>> os.path.isdir('d:\\Python\\sf.txt') 
False 

>>> os.path.isdir('c:\\Python') 
False 

>>># 测 试 是 不 是 已 存在 文件 
>>> os.path.isfile('d:\\Python\\sf.txt') 
True 

>>> os.path.isfile('d:NPython') 
False 
>>># 测 试 文件 相应 信息 
>>> os.path.getatime('d:WPythonWsf.txt") 
1427126400.0 

>>> os.path.getctime('d:\\Python\\sf.txt') 
1427164426.51 

>>> os.path.getmtime('d:\\Python\\sf.txt') 
1427164428.0 

>>> os.path.getsize('d:\\Python\\sf.txt') 

OL 

>>> f-open('d:WPythonWsf.txt',w") 

>>> f.write('helloWn") 

>>> f.close() 

>>> os.path.getsize('d:\\Python\\sf.txt') 

7L 

>>> os.path.getmtime('d:WPythonNsf.txt") 
1427181468.0 

>>># 显 示 文 件 名 

>>> os.path.basename('d:\\Python\\sf.txt') 
'sf.txt' 

>>># 显 示 目 录 路 径 

>>> os.path.dirname('d:NPythonNsf.txt") 
'd:NPython' 

>>># 组 合 路 径 

>>> os.path.join('d:\\','Python\\,'sf.txt') 
'd:\\Python\\sf.txt' 

>>> os.path.join('d:\\''Python\\','sf.txt',"D:\\Python') 
'D:NPython' 

>>># 分 开 目 录 路 径 与 文件 名 

>>> os.path.split('PythonWsf.txt") 

(Python', 'sf.txt") 

>>># 分 开盘 符 与 路 径 

>>> os.path.splitdrive('Python\\sf.txt') 

(^, PythonNsf.txt) 

>>># 分 开路 径 与 文件 扩展 名 

>>> os.path.splitext('Python\\sf.txt') 
(PythonNsf，.txt) 


下 面 在 指定 目录 下 搜索 指定 文件 的 实例 (ch5-5.py)。 
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分 析 : 利用 os 模块 的 walk0 函 数 遍 历 目录 ， 在 遍历 的 文件 中 查找 文件 。 
代码 如 下 : 


# -*- coding: utf-8 -*- 
import os 
def sefile(spath,sfile): 

for sdir,sudir,file in os.walk(spath): 

if sfile in file: 
return (sfile,sdir) 

return None 
spath=raw_input('Please input the path:') 
sfile=raw_input('Please input the file name:) 
f=sefile(spath,sfile) 
if f: 

print('File %s is found,in %s' % (f[0],f[1])) 
else: 

print('%s is not found'% sfile) 


说 明 : 程序 中 定义 了 sefile0 搜 索 文 件 ， 如 果 搜 索 到 则 返回 文件 和 亡 在 目录 ， 和 否则 返回 
None， 根 据 函数 的 返回 值 即 可 判断 是 否 搜索 到 文件 及 文件 所 处 位 置 。 
运行 程序 ， 结 果 如 下 所 示 : 


Please input the path:d:\python 
Please input the file name:fl.txt 
File f1.txt is found,in d:\python\we 


5.3.3 shutil 模块 


shutil 模块 提供 了 高 级 的 文件 和 文件 夹 访 问 功能 ， 包 括 复制 文件 、 删 除 文件 、 复 制 文件 
的 访问 权限 、 递 归 地 复制 目录 树 等 。 
开发 者 需要 注意 ， 即 使 是 高 层次 的 文件 复制 函数 〈shutil.copy0,shutilcopy20) 也 不 能 复 
制 所 有 文件 的 元 数据 。 在 POSIX. 操作 平台 上 ， 这 意味 着 文件 的 所 有 者 和 组 以 及 访问 控制 列 
表 都 将 丢失 。 在 Mac OS 操作 平台 中 ， 文 件 类 型 和 创建 者 的 信息 将 丢失 。 在 Windows 操作 平 
台 上 ， 文 件 所 有 者 、 访 问 控制 列表 和 备用 数据 流 都 将 丢失 。 

1. 目录 和 文件 操作 

常用 的 shutil 模块 的 目录 和 文件 操作 函数 见 表 5-9. 

表 5-9 shutil 模块 的 目录 和 文件 操作 函数 


PRIA ARARNAR NA, TESE EE 
copyfileobi( 源 类 文件 名 ， 目 标 类 文件 名 [， 长 度 ) | 指定 缓存 尺寸 ， 如 果 为 负 ， 表 示 一 次 性 读 入 ， 默 认 会 把 数据 切 分 成 小 志 
复制 ， 以 免 占用 太 多 内 存 
te 将 源 文件 的 内 容 复 人 制 到 目标 文件 ， 匣 于 目标 是 目录 ， 风 便 用 源 文人 
copyfile( 源 文件 名 ， 目 标 文 件 /目录 名 ) 名 在 目标 目录 下 创建 文件 
copymode( 源 文件 名 ， 目 标 文件 各) 将 权限 信息 从 源 文件 复制 至 目标 文件 ， 其 他 信息 不 受 影响 
iA BE 对 权限 信息 、 最 后 访问 时 间 、 最 后 修改 办 间 和 文 作 状 态 从 源 文 作 夏 
Suyu su RS HIM 制 至 目标 文件 ， 其 他 信息 不 受 影 响 
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CH 
"n Om 
TURPE mam 将 源 文 件 复 制 到 目标 文件 ， 加 果 目 标 是 自如， 则 使 用 源 文 件 的 命令 
copy ( 源 文 件 名 ， 目 标 文件 名 ) 在 目标 目录 下 创建 文件 ， 同 名 的 文件 将 被 落 盖 ， 权 限 信息 也 会 被 复制 
copy2 ( 源 文件 名 ， 目 标 文件 名 ) 相当 于 先 调 用 copy0 函 数 , 然 后 调用 copystat() 函 数 
copytree( 源 目录 ， 目 标 目录 ) , EFIE TIBET IURERCUSIRIS EGET, Hiei pata 


rmtree( 


录 ) 


| 除 整个 目录 树 


move( 源 文件 /目录 ， 目 标 目 录 ) 


例如 : 


>>># 导 入 shutil、os 模块 

>>> import shutil 

>>> import os 

>>># 更 改 目录 

>>> os.chdir('d: Edd ) 

>>># 显 示 当 前 目录 下 文件 和 子 文件 
>>> os.listdir('.") 

['sf.txt', 'sd.txt', we'] 

>>># 复 制 文件 

>>> shutil.copy('sf.txt','sfcopy.txt') 
>>># 显 示 当 前 目录 下 文件 和 子 文件 
>>> os.listdir('.") 

['sf.txt', 'sd.txt', we', 'sfcopy.txt'] 

>>># 复 制 目录 


^R 


TR 


= 


>>> shutil.copytree('d:\python',r'e:\book\python') 


>>># 更 改 目 录 

>>> os.chdir(r'e:\book\python') 

>>># 查 看 目录 下 文件 

>>> os.listdir('.") 

['sf.txt', 'sd.txt', 'we', 'sfcopy.txt', 'book'] 


2. 压缩 函数 


shutil 模块 也 提供 了 创建 压缩 文件 的 函 


数 ， 


将 源 文件 或 目录 移 至 目标 


见 表 5-10. 
3& 5-10  shutil 模块 的 压缩 函数 


J 能 


make archive(GC fF 44, IR, [AR Hox, [2 tih E 


KID 


创 


是 zip. tar, bztar 或 gztar， 根 目录 和 基础 目录 默认 都 是 当前 


建 归档 文件 (zip 或 tar) ， 文 件 名 需 包 含 路 径 ， 格 式 参数 可 以 


录 


get archive formats() 


例如 : 
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>>> import os 

>>> import shutil 

>>> os.getcwd() 
'C:\Anaconda\Lib\idlelib' 


返 


Bn 


支持 的 列表 格式 ， 


默认 支持 gztar,bztar,tar,zip 


>>># 查 看 支持 类 型 


>>> shutil.get_archive formats() 


文件 


[(bztar', "bzip2'ed tar-file"), ('gztar', "gzip'ed tar-file"), (tar, uncompressed tar file"), ('zip', 'ZIP file)] 


>>># 将 当前 目录 中 的 内 容 压缩 ， 在 D: 一 下 生成 新 的 压缩 文件 "myarchive.tar” 


>>> shutil.make archive('D:/myarchive','tar") 
'D:/myarchive.tar' 


当前 目录 下 的 内 容 如 图 5-5 所 示 ， 压 缩 文件 下 的 内 容 如 图 5-6 所 示 。 


文件 日 SRO SEV IAD WA) 
MR” 包 全 到 库 中 v ë XE ME 新 建文 件 交 


E ^ "Em 

W Icons. 2015/3/11 9:11 
i idle test 2015/3/11 911 
la) ini 2013/11/10 1636 
O init. .pyc 2015/3/12 8:24 
[F] aboutDialog 2013/11/10 16:36 
[l eboutDielog.pyc. 2015/3/12 8:24 
[8i] AutoComplete. 2013/11/10 16:36 
C) AutoComplete.pyc 2015/3/12 8:24 
[a] AutoCompleteWindow. 2013/11/10 16:36 
C) AuteCompleteWindow.pyc 2015/3/12 824 
[3] AutoExpand. 2013/11/10 16:36 
[l AutoExpand.pyc 2015/3/12 8:24 
[8] Bindings 2013/11/10 1636 
L1] Bindings.pyc 2015/3/12 8:24 
[8] CaliTips. 2013/11/10 16:36 
CO CallTips.pyc 2015/3/12 8:24 
[8] calripwindow 2013/11/10 16:36 
D CaliTipWindow.pyc. 2015/3/12 8:24 
O Changelog 2013/11/10 16:36 
[8] ClassBrowser 2013/11/10 16:36 
O ClassBrowser.pyc 2013/11/12 1:50 
[8] CodeContext 2013/11/10 16:36 
[O CodeContext.pyc 2015/3/12 8:25 
[8] ColorDelegator 2013/11/10 16:36 
C) ColorDelegator.pyc 2015/3/12 8:24 
[8i] configDialog 2013/11/10 16:36 
口 confgpialog.pyc 2015/3/12 8:24 


] 134 个 对 象 


图 5-5 ”当前 目录 下 内 容 


| 文件 ”命令 (Q IRO WQ) HAN) 帮助 (H) 


T-DISITPEIT 


WA 


删除 ER 
[E] “ B myarchivetan, - TAR 压缩 文件 , 解 包 大 小 为 1487,551 F5 


大 小 HUBER BER 
文件 夹 


2015/3/11 9:11 
37 2013/11/10 1... 

122 2015/3/12 824 

[| aboutDialog.py 6575 2013/11/10 1... 
L]aboutDialog.pyc $725 2015/3/12 824 
[5 AutoComplete... 8845 2013/11/10 1... 
[O AutoComplete.... 799 2015/3/12 824 
[P] AutoComplete... 17251 2013/11/10 1... 
| ]AutoComplete.. 12,529 2015/3/12 8:24 
[3] AutoExpand.py 2483 7 2013/11/10 1... 
L]AutoExpand.pyc 2,530 2015/3/12 824 
|) Bindings.py 3434 2013/11/10 1... 
L ]Bindings.pyc 4888 2015/3/12 824 
3] CaliTips.py 8049 2013/11/10 1... 
| ]CallTips.pyc 10,352 2015/3/12 8:24 
[P] CallTipWindow... 6,125 2013/11/10 1... 
|) CallTipWindow... 6.216 2015/3/12 8:24 
L ChangeLog 56,393 2013/11/10 1... 
[| ClassBrowser.py 6,369 2013/11/10 1... 
[DD ClassBrowser.... 9101 2013/11/12 1... 
[P CodeContext.py 8347 2013/11/10 1... 
L ]CodeContext p... 6,630 2015/3/12 825 
|) ColorDelegato... 10373 2013/11/10 1... 
L ]ColorDelegato... 8842 Y 2015/3/12 824 
3] configDialog.py 53,486 2013/11/10 1... 
confiaDialoa.n... 44 510 2015/3112 824. 


E3-u 已 经 选择 1 个 文件 夫 总 计 2 文件 去 和 1,290,511 字 节 (132 个 文件 ) 


p 
CA 
ES 
EH 
=S 
< 
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5.4 高 级 话题 : Python 读 写 Excel 文件 


ak 站 


(workdsheeD 。 每 张 了 
使 用 


Eb 


Excel 是 微软 办 公 软 件 的 重要 组 成 部 分 ， 是 人 们 用 来 存储 、 管 理 
用 于 财经 、 金 融 、 管 理 等 众多 领域 。 在 Python 中 处 理 Excel 表格 ， 

的 库 有 xlrd〈 读 Excel 文件 )、xlwt C5 Excel 文件 ) 与 xlutils (修改 Excel 文件 ， 需 依赖 
xlrd 和 xlwt)。Anaconda 包含 了 本 节 所 需 的 库 ， 不 需要 另外 安装 。 
一 个 Excel 文件 对 应 一 个 工作 每 (workbook )， 工 作 短 中 包含 若干 张 工 作 表 
[ 作 表 包含 若干 行 、 列 交 又 形成 的 单元 格 ， 单 元 格 中 存储 着 数据 信息 。 在 


Sr 


Python 


使 用 时 ， 
>>> 


't1 Excel 


THEE PHAR, DEN 


、 处 理 数 据 和 进行 统计 


访问 Excel 文件 中 的 数据 时 ， 首 先 要 利用 相应 库 (xlrd 或 xlwt) 打开 workbook 
对 象 ， 然 后 通过 workbook 对 象 访问 worksheet 对 象 ， 最 后 通过 worksheet 对 象 访 问 具 体 单元 
格 ， 操 作 相 应 数据 。 
5.4.1 xlwt 库 


xlwt 是 写 Excel 文件 的 Python 库 。 使 用 xlwt 能 够 创建 并 保存 Excel LESS. 


先导 入 xlwt 模块 。 
import xlwt 
文件 前 ， 先 调用 Workbook K AAE TATER, FATTA WwW IKS. 


>>>b1=xlwt.Workbook() 


调用 add_sheetO 函 数 向 工作 钴 中 添加 工作 表 ， 并 指定 工作 表 标 签 


D» 


2» 


sheetl—b1.add sheet('mysheet1') 
sheet2-b1.add sheet('mysheet2") 


o 


调用 write0 函 数 向 单元 格 中 写 入 内 容 ， 第 一 个 参数 为 行 号 ， 第 二 个 参数 为 列 号 ， 行 列 号 


从 0 开始 。 


2» 


2 


sheet1.write(0,0,'cell(0,0)) 
sheet1.write(5,3,'hello world") 


也 可 以 通过 工作 表 的 行 对 象 来 访问 单元 格 。 


D» 


D» 


rowl-sheet2.row(2) 
rowl.write(3,'r2') 


可 以 利 月 


2 


D» 


工作 表 的 列 对 象 对 列 进行 操作 ， 但 要 注意 列 对 象 不 能 调 


coll=sheet2.col(4) 
coll.width=20000 


写 完工 作 敌后 ， 调 用 save0 函 数 保存 工作 德 。 


wi 
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bl.save('d:Nmyfirstbook.xls') 


用 write0 函 数 。 


fE D: 盘 下 找到 刚 创建 的 Excel 文件 “myfirstbook ”， 
5-7 和 图 5-8 所 示 。 


(X]| il 3- S -|* myfirstbook.xls [兼容 模式 ] 

Bi 88) DHE ¿SZ EE RE RE p] 
A A El 
字体 “对齐 方式 数字 ”样式 上 单元 格 

- g M : š š M 


| | 
f| cell (0, 0) 


= B > 


Yo 


A - 立 - 


第 5 章 文件 


打开 查看 其 工作 表 中 内 容 ， 如 


图 5-7 工作 表 mysheetl 中 内 容 
Ka- -|7 myfirstbook.xls [兼容 模式 ] - Microsoft Excel = EX 
EJ ^5 a m 6x 5m =m um FRIA s SEE E: 
don "m " BAHI — MBA E> 
Arial -10 -A - =z% = ”常规 . 
n a- =E- > gzmxmes- PMA- E ñ 
E | srucno h A - ES a3 EST B. 9-v cu 3 Seuex- “(UQ "i d 
ERE 5| 字体 n NFD n 数字 n FR 单元 格 | 编辑 
Al - n s 
B C D E [F F Tg 
1 ! 
3 2 J 
4 
5 | 
6. 
7 4 
8. 
9 
10 
541 | ` 
M 4 > M| mysheetl| nysheet2 /f2 
Sus 


图 


下 面 创建 工作 短 实 例 ， 并 在 其 


分 析 : 导入 xlwt RR, ETER, 


# encoding:utf-8 


5-8 TEK mysheet2 中 内 容 


中 写 入 各 种 类 型 数据 (ch5-6.py)。 
添加 工作 表 ， 并 写 入 各 种 数据 。 
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from datetime import date,time,datetime 
from decimal import Decimal 

from xlwt import Workbook 

wb = Workbook() 

ws = wb.add sheet('Type examples") 

# 数 字 较 长 ， 设 置 列 宽 ， 以 便 正 党 显示 
ws.col(0).width-5000 
ws.write(0,0,u' 第 一 列 为 数字 数据 ') 
ws.write(1,0,3.145) 

ws.write(2,0,2<<40) 
ws.write(3,0,Decimal('3.65")) 
ws.write(4,0,date(2009,3,18)) 
ws.write(5,0,datetime(2009,3,18,17,0,1)) 
ws.write(6,0,time(17,1)) 


ws.write(0, 1," Text") 
ws.write(1,1,5»9) 
ws.write(2,1, True) 
wb.save('types.xls") 


生成 Excel 文件 的 内 容 图 5-9 所 示 。 


J~- *-[s typesxs RAS. — [n] zç 
mm. Pass. : 
A s A ||| È 
n 370 字体 “对 亨 方式 数字 Pit 单元 格 
- F 
: AL d £| 第 一 列 
B 
第 一 列 为 数字 数据 iText 
2 3.145 FALSE = 
3 2.19902E+12 TRUE 
4 3.65 
5 39890 
6 39890.70834 
7 0.709027778 
8 ` 
M 4 h Type exanples 
就 绪 | 四 | 10096 C) U © 


图 5-9 ”工作 表 内 容 


在 本 例 中 ， 长 整 型 转换 成 浮 点 型 数据 ;datetime.datetime, datetime.date 和 datetime.time f£ 
换 成 浮 点 型 数据 ;布尔 型 显示 成 TRUE 或 FALSE。 日 期 、 时 间 型 数据 可 在 Excel 中 通过 设置 
元 格格 式 ， 按 照 用 户 需 求 显示 ， 如 图 5-10 所 示 。 


Im 
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[X] kb 9 - S -|* typesxis RESH. — E] £S 
| xe OEE EE ERE @ = = = 
B š A = % A Ë 7 
da - — 一 | 图 
粘贴 字体 “对齐 方式 数字 ”样式 单元 格 小 
M - M z š al si 
BERE 
AT -e £| 17:01: $~ 
B CE 
1 | 第 一 列 为 数字 数据 Text | 
2 3.145 FALSE = 
3 2.19902E+12 TRUE | 
4 3.65 
5 二 oo 九 年 三 月 十 八 日 
6 2009-3-18 17:00 
[7| 17:01:00] 
8 - 
M4» h Type examples i €i 到 
就 绪 | 73 || EBD] 四 100% O U e 


图 5-10 设置 格式 后 工作 表 内 容 


5.4.2. xlrd J£ 


xlrd 是 读 Excel 文件 的 Python 库 。 使 用 xlrd 能 够 读 取 Excel 工作 短 中 的 数据 。 
使 用 时 ， 首 先导 入 xlrd 模块 。 


>>> import xlrd 
利用 open. workbook() PK Zt T JT TER. 
>>> efile-xlrd.open workbook('d:myfirstbook.xls") 


利用 sheet by index0) 或 sheet_by_name() 函 数 获取 工作 表 ， 记 不 住 工作 表 标 签名 时 ， 建 
议 使 用 sheet_by_index0 函 数 ， 工 作 表 标签 编号 从 0 开始 计数 。 


>>>esheetl=efile.sheet_ by index(0) 
>>> esheet2-efile.sheet by name('mysheet2") 


通过 访问 工作 表 的 cell. value0O 属 性 ， 获 取 单 元 格 内 容 。 


>>> print esheetl.cell value(0,0) 
cell(0,0) 

>>> print esheet1.cell value(5,3) 
hello world 

>>> print esheet2.cell value(2,3) 
r2 


在 获取 workSheet 对 象 后 ， 也 可 通过 下 面 几 种 方式 获取 数据 。 
取 整 行 和 整 列 的 值 ( 数 组 ): 
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>>> esheetl.row_values( 行 号 ) 
>>> esheetl.col values( 列 号 ) 


获取 行 数 和 列 数 ; 


>>> nrows = esheet1.nrows 


>>> ncols = esheet1.ncols 


循环 行列 表 数 据 : 


>>> for i in range(nrows ): 
print sheetTable.row_values(i) 


获取 单元 格 ; 


>>> cell A1 = esheetl.cell(0,0).value 
>>> cell C4 = esheetl.cell(1,1).value 


使 用 行列 索引 : 


>>> cell Al = esheetl.row(0)[0].value 
>>> cell A2 = esheetl.col(1)[0].value 


下 面 读 入 上 一 节 ch5-6.py 代码 生成 工作 禾 的 第 一 列 数据 ， 并 按 顺 序 输出 其 中 的 数值 (ch5- 


7.py)。 


Ar 打开 工作 短 ， 得 到 工作 表 对 象 ， 读 取 第 一 列 数 据 ， 去 掉 列 名 ， 排 序 并 输出 。 


# encoding:utf-8 

import xlrd 

wb —xlrd.open workbook('types.xls') 
ws = wb.sheet by index(0) 
wl-ws.col values(0) 

wln-wl[1:] 

wln.sort() 

print wIn 


运行 程序 ， 结 果 如 下 : 


[0.7090277777777778, 3.145, 3.65, 39890.0, 39890.708344907405, 2199023255552.0] 


5.4.3 xlutils JE 


xlrd 能 读 取 Excel 文件 ， xlwt 能 ja š 


WE? 可 以 借助 xlutils 库 来 完成 修改 操作 。 


保存 Excel 文件 ， 那 么 如 何 修改 现 有 的 Excel 文件 
xlutils 能 够 复制 并 修改 Excel 文件 ， 在 只 读 对 象 


xlrd.Book 和 可 写 对 象 xlwt.Workbook 间架 起 桥梁 。 


使 用 时 ， 先 导入 xlrd 和 xlutils 模块 。 


>>> import xlrd 


>>> from xlutils.copy import copy 
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利用 open workbookO R ZGT I THERE. 

>>> efile=xlrd.open_workbook('d:\\myfirstbook.xls 
£i m LE. 

>>>cfile= copy(efile) 


用 get_sheet() 函 数 获得 工作 表 对 和 象 。 


>>>ws=cfile.get_sheet(0) 
>>>ws.write(0,0,'edited') 
>>>cfile.save('d:Nmyfirstbook.xls') 


修改 后 的 工作 表 内 容 如 图 5-11 所 示 。 


) 


X| a 2 - œ -|= myfirstboo 


| x^ EE 


UMS E — El >€ 
a| a (? o m: 
if "D. 


P 232 A = % A m 
粘贴 C7 字体 对 齐 方式 数字 样式 单元 格 小 
EN “5 
Al z T Æ| edited — |v| 
B C D E 
edited | - 
2 Ë 
3 
4 
5 
6 hello world 
7 
8 x 
z si 
( +) , 


54 小 结 


图 5-11 修改 后 的 工作 表 内 容 


本 章 主要 介绍 了 文件 操作 。Python 对 文件 的 处 理 非常 灵活 ， 不 仪 能 够 处 理 磁盘 文件 ， 也 


能 将 任何 具有 文件 类 型 接口 的 对 象 当 成 文件 来 处 天 


E. 本 章 首 先 介 绍 了 人 磁盘 文件 的 操作 ， 接 着 


介绍 了 StringIO 类 文件 的 操作 ， 然 后 介绍 了 文件 系统 的 操作 ， 包 括 删 除 文件 、 重 命名 文件 、 
更 改 文 件 路 径 、 访 问 文件 信息 、 更 改 文件 信 息 、 创 建 目录 、 删 除 目录 、 访 问 当 前 目录 、 裔 历 


目录 、 判 断路 径 或 文件 是 否 存在 、 处 理 文件 路 径 、 
何在 Python 中 创建 、 读 取 和 修改 Excel 文件 。 


压缩 等 功能 ， 最 后 在 高 级 话题 中 介绍 了 如 
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Python 为 开发 人 员 提 供 了 丰富 的 模块 《前面 章节 已 介绍 过 部 分 模块 ， 如 os 模块 ， 
os.path 模块 )， 利 用 这 些 模块 ， 程 序 员 可 以 快速 、 高 效 地 开发 程序 。 前 面 章节 的 例子 中 ， 已 
多 处 使 用 import xxx 或 from xxx import yyy 的 方式 来 导入 模块 或 模块 中 的 函数 ， 借 助 别 的 模 
块 功能 来 完成 任务 。 开 发 程序 时 ， 程 序 员 不 仅 可 以 利用 Python 的 内 建 模 块 也 可 利用 丰富 的 
第 三 方 模块 ， 甚 至 还 可 以 自 建 模块 。 本 章 将 对 模块 进行 详细 、 系 统 的 介绍 ， 并 基于 模块 / 
包 介 绍 Python 的 程序 发 布 方法 。 


61 模块 


Python 中 ， 模 块 就 是 一 个 代码 文件 ， 模 块 的 文件 名 就 是 模块 名 加 扩展 名 .py。 模 块 中 可 
以 定义 类 、 函 数 和 变量 ， 也 可 以 包含 可 执行 的 代码 。 
程序 开发 中 ， 如 果 需 要 利用 别 的 模块 ， 只 需 用 import 语句 导入 模块 。 格 式 如 下 : 
import 模块 名 
当 Python 解释 器 遇 到 import 语 铅 时 ， 就 会 在 搜索 路 径 下 搜索 并 导入 相应 模块 。 


6.1.1 搜索 路 径 


搜索 模块 时 ，Python 会 按照 sys.path 列表 中 的 路 径 ， 依 次 进行 搜索 。 可 以 通过 sys.path 
查看 模块 搜索 路 径 。sys.path 的 第 一 个 路 径 往往 是 主 模块 所 在 的 目录 。 在 交互 环境 下 添加 一 
个 空 项 ， 它 对 应 当前 目录 。 
>>> import sys 
>>> sys.path 
['', 'C:\Anaconda\Lib\\idlelib', 'C:\Anaconda\python27.zip', 'C:\Anaconda\DLLs', 'C:\Anaconda\lib,, 
'C:\\Anaconda\\lib\\plat-win','C:\\Anaconda\\lib\\lib-tk', 'C:\\Anaconda', 'C:\\Anaconda\\lib\\site-packages', 
'C:\\Anaconda\\lib\\site-packages\\PIL','C:\\Anaconda\\lib\\site-packages\\win32', 
'C\\Anaconda\\lib\\site-packages\\win32\\lib','C:\\Anaconda\\lib\\site-packages\\Pythonwin', 
'C:\\Anaconda\\lib\\site-packages\\setuptools-2.2-py2.7.egg'] 


如 果 缺 省 的 sys.path 中 不 含有 程序 员 自 己 的 模块 或 包 的 路 径 ， 导 入 模块 操作 就 会 失败 ; 


>>> import kk 
Traceback (most recent call last): 
File "<stdin>", line 1, in «module» 


ImportError: No module named 'kk' 


可 以 使 用 如 下 三 种 方法 将 它们 的 路 径 添加 到 Python 的 模块 搜索 路 径 中 去 ， 方 便 
使 用 。 


(1 


NM 


动态 地 添加 模块 路 径 。 


import sys 
sys.path.append( 需 添加 的 模块 路 径 ) 


动态 添加 模块 路 径 ， 需 要 每 次 在 程序 启动 时 ， 向 sys.path 里 添加 。 

(2) 如 果 经 常 需要 用 到 某 路 径 下 的 模块 ， 可 以 在 Python 安装 目录 下 的 \Lib\site-packages 
文件 夹 (通常 用 来 存储 第 三 方 Python 模块 ) 下 建立 一 个 纯 文 本 文件 ， 文 件 内 容 为 欲 添加 的 
模块 路 径 。 保 存 文件 ， 然 后 将 文件 的 扩展 名 改 为 .pth。 

Python 在 遍历 已 知 的 模块 文件 目录 时 ， 如 果 遇 到 .pth 文件 〈 主 文件 名 随意 )， 就 会 将 文 
件 中 记录 的 路 径 加 入 到 sys.path 的 设置 中 。 

(3) 修改 环境 变量 PYTHONPATH 的 值 ， 添 加 新 的 搜索 路 径 〈 多 个 路 径 间 使 用 分 号 分 
SD, üp RE PYTHONPATH 不 存在 ， 则 新 建 它 。 

下 面 以 Windows 7 为 例 ， 讲 解 如 何 新 建 或 修改 环境 变量 。 

在 桌面 上 ， 右 击 【 计 算 机 】 图 标 一 【属性 】 一 【高 级 系统 设置 】 一 【环境 变量 】 按 钮 ， 
在 打开 的 【环境 变量 】 对 话 框 中 ， 查 找 PYTHONPATH， 找 到 则 修改 其 值 ， 否 则 新 建 。 
2.3 版 以 来 ，Python 加 入 了 从 ZIP 归档 文件 导入 模块 的 功能 ， 可 以 将 ZIP 文件 当 作 
目录 处 理 ， 在 文件 中 搜索 模块 。 如 果 .ZIP 文件 中 存在 子 目 录 ， 也 可 以 将 其 子 目 录 添 加 为 搜 
索 路 径 。 


6.1.2 SAU 
前 面 已 经 讲 过 ， 使 用 import 语句 导入 模块 ， 语 法 如 下 : 
import 模块 名 
也 可 以 一 次 导入 多 个 模块 ， 语 法 如 下 : 
import 模块 名 1[， 模 块 名 2[， 模 块 名 3……*]] 


如 果 模块 名 称 太 长 ， 使 用 不 便 ， 可 以 在 导入 模块 时 ， 使 用 as 关键 字 为 其 重 命名 ， 语 法 
如 下 : 


import 模块 名 as 新 模块 名 


613 ”导入 指定 的 模块 属性 


可 以 使 用 from-import 语句 将 指定 的 模块 属性 (函数 或 变量 ) 导入 当前 作用 域 ， 语 法 
如 下 : 


E 


from 模块 名 import 属性 1[， 属 性 2[， 属 性 3……]] 
导入 后 ， 在 当前 作用 域 中 可 以 直接 使 用 导入 的 属性 名 称 ， 不 需要 再 加 模块 名 称 的 前 级 。 
这 种 导入 方式 需要 注意 ， 新 导入 的 属性 名 ， 可 能 会 履 盖 当前 作用 域 已 存在 的 同名 的 对 象 。 并 
且 当 前 作用 域 中 对 属性 对 象 所 做 的 改变 ， 仅 在 当前 作用 域 有 效 ， 不 会 影响 所 导入 模块 中 的 原 
始 属性 值 。 

下 面 看 一 个 导入 属性 示例 〈 对 应 源 代码 为 ch6-1.py 与 ch6-2.py)。 
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模块 ch6_1 内 容 (ch6_1.py): 


# -*- coding: utf- 
#from ....import.. 


a=123 
def show(): 


8 -*- 
.示例 # 


print 'a in module-'a 


导入 模块 ch6 1 内 


容 (ch6-2.py): 


from chó 1 import a,show 


a=345 


print 'a in program-'a 


show() 


运行 ch6-2.py， 运 行 结果 如 下 : 


ain program- 345 


a in module- 123 


6.1.4 ”加 载 模块 


在 程序 开发 中 ， 一 个 Python 模块 可 能 在 多 处 被 import， 但 是 Python 只 会 加 载 其 一 次 ， 
这 是 因为 Python 将 所 有 加 载 到 内 存 的 模块 都 放 在 sys.modules 中 ， 在 加 载 新 的 模块 时 会 先 在 


sys.modules 列表 中 查找 是 否 已 经 加 载 该 模块 ， 如 果 加 载 了 ， 则 只 将 模块 的 名 字 加 入 到 调用 模 
块 的 Local 名 称 空间 中 ; 如 果 没 有 加 载 ， 则 搜索 模块 、 载 入 内 存 ， 并 更 新 sys.modules。 
加 载 模 块 会 导致 这 个 模块 被 “执行 ”” 也 就 是 说 被 导入 模块 的 顶层 代码 将 直接 被 执行 。 


这 通常 包括 设 定 全 局 变量 以 及 类 和 函数 的 声明 。 


加 载 模块 时 不 想 被 运行 的 代码 应 尽 可 能 地 封装 到 函数 中 ， 只 把 函数 和 模块 定义 放 入 模块 


的 顶层 是 良好 的 模块 编 


6.1.5 ”名 称 空间 


名 称 空 间 是 名 称 到 对 象 的 映射 。 向 名 称 空间 添加 名 称 时 ， 需 将 名 称 与 对 应 对 象 绑 定 ，3 


程 习惯 。 


将 对 象 的 引用 计数 加 1。 


Python 程序 执行 时 存在 内 建 名 称 空间 、 全 局 名 称 空间 和 局 部 名 称 空 间 (有 时 为 非 活 动 名 


称 空间 )。Python 的 解 


成 )， 然 后 加 载 执 行 模块 的 全 局 名 称 空间 ， 模 块 执行 时 就 有 了 两 个 活动 的 名 称 空间 。 如 果 程 
序 调用 了 函数 ， 则 Python 解释 器 会 创建 局 部 名 称 空间 。 
程序 中 使 用 一 个 名 称 时 ，Python 解释 器 会 先 从 局 部 名 称 空间 查找 ， 如 果 没 有 找到 ， 接 着 


释 器 会 首先 加 载 内 建 名 称 空间 〈 由 _builtins “模块 中 所 有 内 建 名 称 构 


查询 全 局 名 称 空间 ， 如 果 还 没有 找到 ， 则 碍 询 内 建 名 称 空间 。 如 果 还 没有 找到 ， 则 会 报错 。 


示例 如 下 : 


2» yu 


Traceback (most 
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recent call last): 


File "<pyshell#0>", line 1, in «module 
yu 


NameError: name 'yu' is not defined 


因为 查找 顺序 的 原因 ， 如 果 局 部 名 称 所 


E 间 、 全 局 名 间 和 


Wem 


内 建 名 称 空 间 中 有 同名 的 对 


象 ， 则 局 部 名 称 空间 中 的 对 象 会 遮蔽 全 局 名 称 空 间 和 内 建 名 称 空间 中 对 应 的 对 象 ， 而 全 局 名 
称 空间 中 的 对 象 会 遮蔽 内 建 名 称 空间 中 的 对 象 。 


6.1.6 “编译 的 ”Python 文件 


Python 中 一 旦 被 引用 的 模块 (假设 为 example.py) 被 成 功 编 


本 example.pyc 就 会 被 创建 。 如 果 有 意外 
视 为 无 效 并 被 忽略 ; 如果 创建 成 功 则 example.py 的 
载 入 时 ， 如 果 两 个 文件 的 修改 时 间 不 匹配 ，.pyc 文 伯 

Python 载 入 模块 时 ， 如 果 模 块 有 可 用 的 .pyc 文人 


就 被 忽略 。 
F， 则 会 使 用 


导致 example.pyc 创建 不 成 功 ， 则 文 伯 
侈 改 时 间 被 记录 在 example.pyc H 


译 ， 其 对 应 的 预 “编译 ” 版 


F example.pyc 


.pyc 文件 提高 模块 的 加 载 速 


度 。 当 程序 运行 需要 加 载 多 个 模块 时 ，.pyc 文件 能 够 有 效 地 提高 和 


6.1.7 ”自动 导 人 模块 
Python 中 有 些 模块 ， 在 解释 器 ] 


H 


序 的 启动 速度 。 


E 常 启动 时 会 被 自动 导入 ， 用 于 完成 系统 相关 操作 。sys 


模块 的 modules 变量 中 存储 了 完整 日 


| 成功 导 入 的 模块 的 信息 。 


sys.modules 是 一 个 字典 变量 ， 成 功 导入 的 模块 名 为 键 ， 模 块 的 位 置 


为 值 。 程 序 员 可 以 通 


B 


过 sys.modules 变量 来 查看 已 成 功 导 入 的 模块 名 和 所 处 位 置 。 
6.1.8 ”循环 导入 


循环 导入 (circular import). 是 一 种 死 循 环 ， 即 A 代码 需要 B 代码 才能 执行 ， 可 偏 1 


代码 是 建立 在 A 代码 基础 上 。 例 如 建立 cirl.py 5 cir2.py XH 


#cirl.py 
from cir2 importb 
def a(): 
#cir2.b() 
bO 
aQ 


#cir2.py 
from cirl import a 
def b(): 
print ('a() has run in cir2') 
def c(): 
print ("c() in cir2") 
#from cirl importa 
a 
cO 


=F 


Fil F: 


139 


Python Fp 4 Pp Jf] 


HÍT python cirl.py, 出 现 如 下 错误 : 


E:\python\ch6\ 源 代码 >python cirl.py 
Traceback (most recent call last): 
File "cirl.py", line 2, in <module> 
from  cir2 import b 
File "EA python\ch6\ 源 代码 \cir2.py", line 1, in «module? 
from cirl importa 
File "EA python\ch6\ 源 代码 \cirl .py", line 2, in «module? 
from  cir2 import b 


ImportError: cannot import name b 


这 就 是 一 种 循环 导入 错误 。 
下 面 给 出 三 种 解决 办 法 。 


(1) 延迟 导入 ， 把 import 语句 写 在 方法 或 函数 里 面 ， 将 它 的 作用 域 限 制 在 局 部 。 修 改 


cir2.py 文件 为 : 


#cir2.py 
#from cirl importa 
def b(): 
print ('a() has run in cir2!) 
def c(): 
print ("c() in cir2") 
from cirl import a 
al) 
cO 


(2) 将 from xxx import yyy AX import xxx， 在 调用 时 使 用 


a 


为 cirll.py 与 cir22.py。 文 件 内容 如 下 : 


#cirll.py 
import cir21 
print ("this is module a.py") 
defa(): 
print ("hello a" ) 
cir21.b() 


#cir21.py 
from cirll import a 
print ( "in module b.py") 
def b(): 
print ("hello b") 
def c(): 
#from cirll importa 
a 
cO 
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HÍT python cirll.py 的 运行 结果 为 : 


this is module a.py 
in module b.py 
hello a 

hello b 

this is module a.py 


(3) 重新 组 织 代码 ， 将 存在 循环 导入 的 文件 合并 为 一 个 文件 或 者 把 import 的 资源 部 分 提 
取 到 独立 文件 中 ， 从 而 消除 工程 项 目 中 的 循环 引用 


6.2 € 


包 (Package) 可 以 看 成 是 模块 的 集合 。 包 可 以 将 有 联系 的 模块 组 织 在 一 起 ， 从 而 有 诡 
避免 模块 名 字 的 冲突 问题 ， 并 使 组 织 结构 更 加 清晰 。 

Python 中 ， 只 要 一 个 文件 夹 下 面 有 init .py 文件， 那么 该 文件 夹 就 可 以 看 作 是 一 个 
包 。 包 下 面 还 可 以 包括 子 包 。 通 过 包 这 种 结构 ， 方 便 了 模块 的 管理 和 使 用 

包 和 模块 其 实 很 类 似 ， 如 果 查 看 包 的 类 型 ， 可 以 看 到 它 其 d «type module>。 导 入 
包 时 的 查找 路 径 也 是 由 sys.path 决定 的 。 
导入 包 的 过 程 和 导入 模块 的 基本 一 致 ， 只 是 导入 包 的 时 候 会 执行 此 包 目 录 下 的 
init _.py， 而 不 是 模块 里 面 的 语句 。 

另外 ， 如 果 只 是 单纯 地 导入 包 ， 而 包 的 _init py 中 又 没有 明确 的 其 他 初始 化 操作 ， 那 
么 此 包 下 面 的 模块 是 不 会 自动 导入 的 。 

例如 ， 一 个 简单 的 包 的 目录 结构 如 下 : 


Pac/ 
. init .py 
Subpacl/ 
. init .py 
Modul.py 
Subpac2/ 
. init .py 
Modu2.py 


H, Pac 是 最 顶层 的 包 ，Subpacl 和 Subpac2 是 它 的 子 包 。 在 导入 时 ， 可 以 使 用 下 列 


Nm 


N 
4 


方法 : 


from Pac.Subpacl import Modul 
import Pac.Subpacll 

from Pac.Subpac2 import Modu2 
import Pac.Subpac12 


假设 Modul.py 中 内 容 如 下 : 


a=4 
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def myadd(c1,c2): 
return(a*c1-c2) 


则 采用 From Pac.Subpacl import Modul 方式 导入 后 ， 调 用 结果 如 下 : 


>>> Modul.a 

4 

>>> Modul.myadd(4,5) 
13 


若 采 用 >>> from Pac.SubPacl.Modul import a,myadd 方式 导入 后 ， 则 可 以 省 略 模块 名 ， 


直接 使 用 变量 名 称 和 函数 名 调用 ， 如 下 : 


>a 

4 

>>> myadd(6,7) 
17 

>> 


HRH import 导入 Pac.SubPac1， 包 下 的 _init .py 中 又 没有 明确 的 其 他 初始 化 操作 ， 


那么 此 包 下 面 的 模块 Modul 是 不 会 自动 导入 的 ， 所 以 下 面 的 调用 方式 会 出 错 。 


>>> Modul.a 
Traceback (most recent call last): 
File "<pyshell#4>", line 1, in «module 
Modul.a 
NameEzrror: name 'Modul' is not defined 
>>> Modul.myadd(4,5) 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in «module 
Modul.myadd(4,5) 
NameError: name 'Modul' is not defined 


63 ”高 级 话题 : 程序 打包 


程序 写 完 交付 用 户 使 用 时 ， 一 般 需 要 将 程序 做 成 安装 包 形 式 ， 因 为 用 户 通常 是 非 程序 


员 ， 他 们 可 能 不 知道 如 何 安装 相关 的 Python 库 文件 或 设置 相关 路 径 。 所 以 将 程序 做 成 一 键 


安装 形式 ， 可 方便 用 户 使 用 。 


Python 提供 了 Distutils, Setuptools, Py2exe. Pylnstaller, cx freeze 等 程序 打包 


其 中 setuptools 是 Distutils 的 增强 工具 ，Py2exe、PyInstaller、cx_freeze 是 
下 制作 exe 文件 的 工具 。Distutils 包含 在 Python 的 标准 版 发 行 包 中 ， 
Distutils 。 


6.3.1 Distutils 
首先 建立 一 个 简单 的 Python 文件 hello.py， 代 码 如 下 : 
142 


Xo 


y 人 


Windows `l & 


E 讲 解 


y 


print("Hello") 


之 后 将 其 打包 交付 用 户 使 用 。 步 骤 如 下 : 
(1) 建立 一 个 setup.py 文件 ， 内 容 如 下 : 


from distutils.core import setup 
setup(name='hello', 
version='1.0', 
description="hello world", 
author="abc", 
py_modules=['hello'], 
) 


说 明 : 
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setup.py 的 中 py modules 是 一 个 模块 的 列表 ，setup 将 在 发 布 版 本 的 模 


的 模块 hello.py， 并 将 hello.py 包含 在 发 布 版 本 中 。 


Lj py modules 对 应 的 关键 字 ， 有 packages. scripts. Extension, 


data files 等 。 
Packages 表示 一 个 包 的 列表 ， 假 设 packages 关键 字 中 包含 了 mypack 关键 字 ， 则 setup 
将 在 发 布 版 本 的 根 目录 中 找到 一 个 子 目 录 mypack， 并 在 发 行 版 本 中 包含 mypack/ _ 
init .py， 并 包含 mypack 目录 下 的 所 有 *.py。 但 需要 注意 的 是 并 不 包含 mypack 下 子 目 录 中 


的 内 


录 中 找到 列表 


ext modules、 


Ni 


Extension 用 于 Python 扩展 ， 可 包含 C 语言 文件 的 .c 文件 、C++ 文 件 的 .cpp XH 
Fortran 文件 以 及 SWIG 的 .i 文件 。 对 包含 了 Extension 关键 字 的 setup.py 文人 
Setup.py build 将 调用 相应 的 编 i 


o 


相应 的 .py 文件 。 在 Extension 中 可 以 指定 库 的 位 置 、 包 含 路 径 等 参数 信息 。 


data files 用 于 包含 任何 类 型 的 文件 到 发 布 版 本 文件 中 ， 例 如 图 片 文件 等 。 


OO 执行 打包 命令 ， 进 行 打包 。 
>>> python setup.py sdist / 源码 安装 包 


之 后 可 能 出 现 提 示 报 警 信息 ， 执 行 结果 的 主要 提示 信息 如 下 。 


copying files to hello-1.0... 
copying hello.py -> hello-1.0 
copying setup.py — hello-1.0 
creating dist 
creating 'dist'hello-1.0.zip' and adding 'hello-1.0' to it 
adding 'hello-1.0Whello.py' 
adding 'hello-1.00PK G-INFO' 
adding 'hello-1.0 setup.py' 
removing 'hello-1.0' (and everything under it) 


Tr 


4 


F， 执 行 Python 


对 器 〈 例 如 GCC 编译 器 )， 把 Extension 中 指定 的 文件 编译 为 


从 该 提示 信息 看 出 ， 该 命令 创建 了 dist 目录 ， 并 将 要 打包 的 文件 复制 到 hello-1.0.zip 的 


压缩 文件 中 。 
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除了 build. install, sdisk MS, HA bdist、 bdist rpm, bdist wininst 用 于 生成 不 同 操 
作 系 统 的 安装 包 。 

在 Windows 下 ， 把 .py 文件 转换 成 exe 文件 不 仅 可 以 降低 用 户 对 Python 的 了 解 程 度 ， 而 
且 便 于 保护 自己 的 软件 产品 。 生 成 exe 文件 的 基本 步骤 与 Distutils 相同 ， 首 先 创建 一 个 
setup.py 文件 ， 在 其 中 包含 符合 相应 的 软件 〈 例 如 Py2exe) 要 求 的 格式 ， 然 后 调用 相应 命令 
生成 exe 文件 。 

(3) 安装 

hello-1.0.zip 文件 可 以 直接 给 用 户 ， 用 户 可 将 该 文件 解 包 ， 执 行 python setup.py install 
完成 自己 电脑 的 安装 过 程 。 

在 第 二 步 打包 时 也 可 以 使 用 下 列 命令 ， 直 接生 成 在 Windows 或 Linux 下 可 以 直接 运行 的 
安装 文件 。 


= 


>>> python setup.py bdist_wininst //Windows 下 使 
>>> python setup.py bdist rpm //Linux 下 使 用 


在 Windows EX Linux 下 直接 运行 安装 文件 即 可 安装 。 


6.3.2 py2exe 


py2exe 作为 Distutils 的 扩展 ， 能 够 把 Python 脚本 快速 转换 为 exe 文件 ， 从 而 可 以 在 任 
何 一 台 装 有 Windows 的 计算 机 上 运行 。py2exe 可 从 https;//pypi.python.org/pypi/py2exe/ F 2X 
安装 ， 或 者 通过 pip 命令 安装 。 下 面 仍 以 hello.py 为 例 进 行 讲解 。 步 又 如 下 : 

(1) 建立 一 个 setup.py 文件 ， 内 容 如 下 : 


from distutils.core import setup 
import py2exe 
setup(console=["hello.py"]) 


(2) 执行 下 述 命 令 ， 将 hello.py 转换 为 可 执行 文件 。 


T 


python setup.py py2exe 
这 样 便 完成 了 从 hello.py 文件 到 .exe 文件 的 转换 。 结 果 会 生成 dist 和 build 两 个 文件 
K. dist 文件 来 下 ， 会 有 一 个 hello.exe 可 执行 文件 以 及 各 种 动态 库 文件 。 需 要 注意 的 是 ， 生 
成 的 exe 文件 不 能 脱离 dist 文件 夹 下 的 动态 库 文 持 。 


0.4 小 结 


本 章 主 要 介绍 了 如 何 组 织 Python 代码 ， 使 得 代码 有 更 好 的 层次 。 模 块 与 包 的 代码 组 织 模式 
类 似 Java 的 类 库 ， 采 用 了 目录 /文件 的 方式 进行 代码 的 组 织 ， 该 方式 有 别 于 C/C++ 的 库 文件 组 织 
结构 。Python 以 包 /模块 为 基础 进行 代码 发 布 ， 并 提供 了 多 种 发 布 方式 ， 其 中 Distutils 是 Python 
自 带 的 标准 方式 。 另 外 Python 的 代码 也 可 制作 生成 exe 格式 ， 方 便 Windows 下 的 发 布 。 
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B 7 ni 


类 


Python 是 一 种 本 


但 函数 中 变量 只 有 


的 数据 类 型 。 
的 类 (class)。 类 可 以 定义 新 
类 型 的 系统 以 及 与 其 他 系统 的 
而 模拟 任何 系统 。Python KAŽ. 


11 基本 概念 


类 可 以 作为 一 个 用 户 定义 的 数据 
法 ) 的 对 象 。 一 个 
本 的 数据 类 型 一 样 工作 。Python 


1 问 对 象 的 语言 。 前 面 已 经 使 
数据 均 是 对 象 。 字 符 串 、 字 典 和 列表 等 也 是 对 象 ， 
比如 Python 中 所 有 字符 串 都 可 以 调用 字符 串 函 数 lower0 返 回 一 个 对 应 的 小 写字 符 串 ; 
Python 中 所 有 的 列表 都 文 持 append0 函 数 添 加 列表 对 象 ，remove0 函 数 删除 列表 对 象 。 
虽然 Python 中 的 数据 类 型 
是 有 限 的 ， 通 过 基本 类 型 无 法 


DINZ, BRAA HPWH. Python 中 的 


多 种 多 样 ， 但 它 
草 述 现实 世界 的 所 有 人 信息。 虽然 函 数 对 模块 化 代码 是 有 用 的 ， 


在 执行 函数 时 才 有 生存 


许多 语言 ， 


类 可 


以 是 基 


都 有 个 性 化 的 数据 


期 ， 所 以 函数 不 能 存储 状态 ， 也 就 不 能 用 来 定义 新 
类 型 ， 如 在 C 中 的 结构 (struct)、Java、C++ 中 
的 数据 类 型 ， 类 的 实例 即 对 象 有 足够 的 延展 性 ， 能 够 模拟 任何 
关系 。 程 序 员 可 以 根据 需要 利用 类 来 定义 自己 的 数据 类 型 ， 从 


类 型 


都 有 其 相关 联 的 函数 (方法 ) 及 其 属性 。 


门 不 足以 覆盖 所 有 的 信息 建 模 需 求 ， 能 力 还 


RT 


述 一 组 有 相同 特性 (属性 ) 和 相同 行为 ( 方 


因 组 、 人 或 序列 的 抽象 。 可 把 任何 对 象 抽象 成 类 ， 类 可 以 像 基 
] class 作为 类 定义 的 关键 字 。 


一 个 实例 是 一 个 类 的 实现 ， 是 抽象 的 具体 化 。 举 例 来 说 ， 如 果 程 序 中 定义 了 一 个 Dog 


行为 定义 ， 但 
每 个 对 象 都 有 上 自身 的 特点 《属性 )， 例 如 习 


具体 的 所 


以 抽象 为 一 个 类 。 


量 ， 但 尽管 属性 值 不 同 ， 至 少 它们 分 享 相同 “ 居 


X, WE (Pekingese) 与 牧羊 犬 (ShepherdDog ) 是 两 种 不 同 实例 ， 它 们 具有 相同 的 属性 和 
直 以 及 行为 表现 是 相互 独立 的 。 


量 〈weight)。 当 然 京 巴 与 牧羊 犬 有 不 同 重 


性 的 类 型 ” 拥有 相同 的 行为 能 力 ， 因 此 可 


方法 是 属于 类 的 函数 ， 定 义 了 从 类 派生 对 象 的 “行为 例如 DNA 类 的 翻译 方法 可 以 将 


DNA 类 对 象 翻译 成 


示 了 基本 类 型 与 派生 


之 间 的 相似 性 。 


为 。 例 如 一 个 哺乳 动物 类 


性 质 和 行为 ， 同 时 又 有 自 


己 独特 的 性 


mammal， 其 子 类 猫 


白质 的 氨基 酸 序列 。 简 单 地 说 ， 方 法 只 不 过 是 类 相关 联 的 函数 。 

继承 是 在 相关 的 类 之 间 传 递 相同 的 属性 与 行为 ， 使 得 类 之 间 相 关 ， 而 不 是 彼此 独立 ， 表 
一 个 基本 类 型 具有 所 有 派生 类 型 共有 的 特性 和 行 
类 Cat 与 狗 类 dog， 继 承 了 哺乳 动物 类 所 有 的 


质 和 行为 。 


多 态 性 是 不 同类 型 的 对 象 执 行 相同 的 方法 但 得 到 不 同 结 果 。C++ 中 采用 一 种 晚 绑 定 机 


制 ， 以 保证 获取 正 硼 
不 同 含义 ， 在 7.5 节 有 具体 


> HÉUETSSITER 


述 。 


行为 结果 。 但 Python 属于 动态 语言 ， 多 态 性 具有 
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12 类 定义 


同 其 他 面向 对 象 编程 语言 一 样 ，Python 中 的 类 也 是 一 种 用 户 自 定义 的 数据 类 型 ， 其 基本 
的 语法 格式 是 : 


class <name>(superclass, ...): # 定义 类 
"类 文档 字符 串 "" 
data = value # 共享 的 类 变量 
def method(self ...): # 类 中 的 方法 
selfmember = value # 实例 的 数据 


类 定义 从 关键 字 class 开始 ， 并 包含 整个 缩 进 代 码 块 ， 类 中 定义 的 方法 和 属性 构成 了 类 
的 名 字 空 间 (name space), Python 中 的 类 分 为 经 典 类 和 新 式 类 ， 经 典 类 可 不 继承 任何 类 ， 
即 可 以 没有 superclass， 新 式 类 必须 有 继承 ， 其 superclass 可 以 是 自己 编写 的 类 ， 或 者 
object 类 。 经 典 类 的 缺陷 是 不 能 对 标准 类 子 类 化 以 及 多 重 继承 存在 方法 解释 顺序 (MRO) 的 
问题 ， 因 此 Python 3 不 再 支持 经 典 类 。 通 常 将 类 放 在 模块 的 顶层 进行 定义 ， 便 于 类 实例 在 
源 文件 中 的 创建 。 
个 类 通常 会 有 多 个 方法 ， 它 们 都 以 关键 字 def 开头 ， 并 且 第 一 个 参数 都 是 self, RE 
类 实例 对 和 象 本 身 。self 相当 于 C++ 中 的 关键 字 this， 其 作用 是 传递 一 个 对 象 的 引用 。 

Python 中 类 的 属性 位 于 类 的 名 字 空 间 中 ， 可 以 被 所 有 的 类 实例 共享 ， 这 一 点 与 C++ 和 
Java 相同 。 访 问 类 属性 时 可 以 不 事先 创建 类 的 实例 ， 而 直接 使 用 类 名 。 如 下 例 中 直接 通过 类 
名 来 访问 类 属性 ， 对 类 实例 进行 计数 ， 下 面 的 代码 通过 类 属性 counter 对 类 的 实例 进行 统 
计 ， 创 建 类 实例 时 ， 计 数 加 1， 在 释放 该 实例 时 ， 计 数 减 1。 该 例 用 到 本 章 将 要 讲解 的 实例 
属性 、 类 初始 化 以 及 类 的 析 构 。 


>>> class Person(object) : 
counter= 0 
def init (selfage): 
self.age-age 


Person.counter 4—1 # 通过 类 名 来 访问 类 属性 
def del (self): 
Person.counter--1 # 通 过 类 名 来 访问 类 属性 


>>> Person.counter 

0 

>>> pl-Person(20) 

>>> p2=Person(21) 

>>> p3-Person(22) 

>>> print (Person.counter,pl.counter ,p2.counter,p3.counter) 
3333 

>>> del pl 

>>> print (Person.counter,p2.counter ,p3.counter) 

222 
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»»»p2.counter-10  # 通 过 类 实例 来 访问 类 属性 


>>> print (Person.counter ,p2.counter ,p3.counter) 
2102 


除了 


Python 的 对 象 模型 所 提供 的 。 表 7-1 列 出 了 这 些 类 属性 。 


自 定义 的 类 属性 ，Python 中 的 每 个 类 其 实 都 具有 一 些 特殊 的 类 属性 ， 它 们 都 是 


R71 类 属性 


属 性 名 说 — UJ 
_ bases - 该 类 的 所 有 基 类 组 成 的 元 组 
_dict 类 的 属性 
. doc _ 类 的 文档 字符 串 
. module . 类 的 模块 名 
..name . 类 的 名 字 
在 上 述 代码 中 ， 定 义 Person 时 没有 添加 文档 字符 串 ， 因 此 Person._doc_ 无 返回 值 。 类 
的 文档 字符 串 与 模块 、 函 数 的 文档 字符 串 定义 相同 ， 均 需 在 定义 的 紧 随行 定义 ， 并 且 文档 字 
符 串 不 被 继承 。Person 类 在 Python 2.7 中 执行 的 结果 如 下 : 
>>> Person. bases - 
(«type 'object'>,) 
>>> Person. dict . 
dict proxy({ module ':' main ',' del ':<function del at 0x0000000002F522E8^, 'counter'": 0, 
' dict ':<attribute' dict 'of'Person'objects»,' weakref ':<attribute' weakref 'of'Person' objects, 
' doc * None,' init ': «function init at 0x00000000026FB438»3) 
>>> Person. doc _ 
>>> Person name . 
'"Person' 
在 Python 3 中 的 执行 结果 如 下 : 


如 下 : 


>>> Person. bases - 

(<class 'object'>,) 

>>> Person. dict . 

mappingproxy({ del_ ': <function Person. del atOx030C6C00>,' module 
«function Person. init at 0x030C67C8>, '__weakref ': <attribute '__weakref 'of'Person' objects, 


' dict ':<attribute' dict 'of'Person' objects>, 'counter': 0,'__doc__": None}) 


"' main '' init * 


>>> Person. doc _ 


1 1 


| main 


>>> Person name . 


'Person' 


在 Person 2.7 中 Person 如 不 继承 自 object， 即 为 经 典 类 型 ， 则 Person. dict ”执行 结果 


>>> Person. dict - 
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f del ':<function del  at0x0000000002F523C8»,' 


module *:' 


' jnit ': «function. init — at 0x0000000002F523587] 


Python 2 中 经 典 类 的 _dict 是 可 修改 的 ， 即 可 通过 class. dict ”直接 添加 新 的 类 属 
为 mappingproxy，Python 2 中 新 式 类 返回 的 是 
过 class. dict 添加 新 的 类 属性 ， 但 可 通过 setattr(classname, 
BJ dict 是 可 修改 的 ， 也 带 来 逢 


TE. fH Python 3 中 类 的 _dict 返回 


dict proxy， 二 者 均 不 可 通 


attribute name，value) 方 式 添 加 类 的 新 属性 。 


F dict 的 应 用 。 
1.3 实例 
7.3.1 创建 实例 


从 面向 对 象 的 角 
个 实体 的 


值 


实例 ! 


main ''counter:0,' doc _': None, 


多 基 


度 看 ， 类 是 对 数据 及 其 相关 操作 的 封装 ， 而 类 实例 则 是 对 现实 生活 中 某 


>>> class MyClass(object) : 


pass 
>>> mc-MyClass() 


Z. Python 中 创建 实例 的 格式 与 其 


他 语言 不 同 ， 无 new 关键 字 。 例 如 : 


Python 的 实例 属性 有 一 个 非常 有 趣 的 地 方 ， 那 就 是 使 用 它们 之 前 不 必 像 CH+ 和 Java 那 


样 先 在 类 中 进行 声明 ， 因 为 这 些 者 
一 特性 的 确 非常 灵活 ， 但 有 了 时 也 允 


需要 知道 对 象 所 属 的 类 ， 以 便 能 够 调用 不 同 的 实现 方法 ， 这 在 C++ 和 Java 
不 难 实现 ， 但 对 Python 来 讲 可 就 不 那么 简单 了 ， 


型 。 例 如 : 


>>> class  A(object): 
pass 

>>> a-A() 

>>> a.m=1 

>>> print (a.m) 

1 

>>> a.m= “hello” 

>>> print (a.m) 

hello 


实例 与 类 之 间 的 对 应 关系 可 通过 函数 isinstance() 判 断 ，isinstance0 月 
否 为 isinstance 参数 指定 的 类 型 或 该 类 型 的 子 类 (直接 继承 、 间 接 继承 、 虚 继承 均 可 )。 其 基 


本 的 语法 格式 是 : 


是 可 以 动态 创建 的 。 作 为 一 门 动 


ET 


问题 。 例 如 在 许多 针对 接口 


isinstance (instance object, class object) 


例如 : 
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态 类 型 语言 ，Python 的 这 


的 设计 模式 | 


， 通 常 都 


等 强 类 型 语言 中 


因为 Python 中 的 每 个 变量 都 没有 固定 的 类 


日 于 判断 一 个 对 象 是 


>>> class Base(object): 


pass 

>>> 

>>> class Test(Base): 
pass 

>>> 


>>> b = Base() 
>>> print isinstance(b,Test) # 基 类 的 实例 不 是 子 类 的 实例 
False 


>>> print isinstance(b,Base) 

True 

>>> t = Test() 

>>> print isinstance(t,Base) # 子 类 的 实例 是 基 类 的 实例 
True 


>>> print isinstance(t, Test) 


和 类 一 样 ，Python 中 的 每 个 类 实例 也 具有 一 些 特殊 的 属性 ， 它 们 都 是 由 Python 的 对 象 


模型 所 提供 的 。 表 7-2 列 出 了 这 些 属性 。 


表 7-2 实例 属性 


属 性 名 说 HJ 
dict 实例 名 字 空 间 的 字 奥 变量 
. clas . 生成 该 实例 的 类 


7.3.20 初始 化 


Python. 中 有 两 个 容易 混淆 的 初始 化 函数 ， 即 _init P new ， 二 者 有 本 质 不 同 。 


昌 于 初始 化 


new 在 创建 实例 时 调用 ， 用 于 创建 实例 ，_init_ 在 类 实例 创建 后 调用 ， 月 
实例 。 


在 实例 创建 后 ，_init 0 方法 被 立即 调用 。 int 0 的 第 一 个 参数 与 其 他 类 方法 相同 ， 


均 为 selff， 也 就 是 将 要 新 创建 的 对 象 。 并 且 init OWBM. wR int O! 
值 ， 会 出 现 TypeError。 例 如 : 


>>> class A(object) : 
def init (self): 
return 1 
>>> a-A() 
Traceback (most recent call last): 
File "<pyshell#34>", line 1, in «module 
a=A0 
TypeError: _ init_ Ó should return None, not 'int' 


存在 返回 
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new 是 创建 实例 的 第 一 步 ， 调 用 后 返回 类 的 实例 。_new ”的 第 一 个 参数 为 cls， 通 
常情 况 下 不 用 重 载 _new”， 除 非 继 承 不 可 变 类 型 如 str、int、unicode 或 元 组 。 下 面 的 代码 
(ch7-1.py) 演示 了 new 与 _init 的 调用 关系 。 


class A(object): 

def new (cls,*args,**kwargs): 
print cls 
print args 
print kwargs 

def init (self, a,b): 
print "in init" 
print self 
self.a,self.b-a,b 


a-A(1,2) 


该 程序 在 创建 类 时 ， 首 先 调 用 _new__， 但 因 _new_ ”没有 返回 类 的 实例 ， 所 以 _init _ 
未 被 调用 。 如 果 执 行 print a， 会 返回 None。 运 行 结果 如 下 : 


LH 


M 


«class' main .A> 
(1,2) 
Ü 
下 面 的 代码 〈ch7-2.py) 演示 了 通过 _new_ 返回 一 个 A 的 实例 ， 然 后 调用 _init ， 并 
在 _init_ 中 给 新 创建 的 实例 添加 属性 。 


T 


import datetime 
class A(object) : 
def new (cls,*args,**kwargs): 
print("in new" 
instance -object. new  (cls,*args,**kwargs) 
instance. dict ['create']-datetime.datetime.now() 
print ("end new") 
return instance 
def init (self,a,b): 
print ("in init" ) 
self.a,self.b-a,b 


a-A(1,2) 
print("output a. dict ") 
printa. dict — 


该 程序 的 运行 结果 如 下 : 


innew 

end new 

in init 

output a. dict _ 
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{'a': 1, 'create': datetime.datetime(2015, 8, 2, 14, 25, 39, 886000), 'b': 2} 


733 dict 属性 


SKAR dict 返回 实 例 的 属性 。Python 属于 动态 语言 ， 实 例 的 属性 与 许多 语言 有 明显 
差别 ， 可 以 在 任何 时 候 添加 新 的 属性 。 下 面 的 代码 (ch7-3.py〉 演 示 了 该 特性 : 


class C(): 
pass 
c-C() 
print(c. dict ) 
c.age -10 
print(c. dict  ,c.age) 


运行 结果 为 
0 
({'age': 10}, 10) 
Python. 提供 了 一 系列 *attr(0) 函 数 用 于 对 对 象 属性 进行 操作 ， 有 getattr()、setattr()、 
delattr()、hasattr()。 getattr 0) 用 于 读 取 对 象 的 属性 值 。 下 面 的 函数 (ch7-3.py)〉 裔 历 了 上 例 中 ¢ 
对 象 的 字典 ， 并 将 属性 名 和 属性 值 打印 输出 。 


def print attribute(obj): 
forattrinobj. dict : 
print (attr, getattr(obj,attr)) 
print attribute(c) 


执行 结果 为 : (age', 10). 

M dict “属性 可 以 读 写 ， 那 么 就 可 通过 dict “直接 添加 实例 的 变量 ， 从 而 改变 实例 
字典 。 下 面 的 例子 演示 了 __dict 属性 的 用 法 。 字 典 的 访问 方式 是 dict[mame]， 将 字典 赋值 
给 实例 的 字典 属性 ， 从 而 通过 实例 的 _ dict_ 可 以 将 字典 改 成 点 号 访问 形式 。 


>>> class Messager(object): 
def init (self,**kwargs): 
self. dict -—kwargs 
>>> M-Messager(** ("f':12,"a":324]) 
>>> M. dict - 
(a: 324, 'f: 12] 
>>> M.a 
324 
>>> Mf 
12 
>>> n=Messager(f=21,a=321) 
>>> n.f 
21 


>>>n. dict | 
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{a: 321,f:21} 

>>> def KO 
N-Messager(a-2 1,b—2) 
return N 

>>> KO.a 

21 


734 ”特殊 方法 


ER Y init ~ new LUE del 的 类 构造 、 析 构 的 相关 方法 ， 另 有 一 些 特殊 方法 可 模 


拟 标 准 类 型 、 重 载 操作 符 等 功能 。 


sr. 5 repr 是 两 个 常用 的 方法 ， 虽 然 都 返回 字符 串 ， 但 目的 不 同 : sr ÆT 


可 读 ; repr 是 为 了 准确 。print 函数 调用 的 是 _str 。 _ repr 


eval(repr(c))==c。 下 面 的 代码 演示 了 字符 串 的 _ str_ 与 _repr 的 返 
eval 的 差异 。 


>>> x="foo" 
>>> str(x) 
'foo' 


>>> x. str () 


'foo' 

2» x. repr () 
"foo" 

>>> eval(x.__repr__0) 
'foo' 


>>> eval(x. str ()) 
Traceback (most recent call last): 
File "<pyshell#1 8>", line 1, in «module 
evalx. str ()) 
File "<string>", line 1, in «module 


NamekEzrror: name 'foo' is not defined 


的 实现 要 保证 


器 值 差 寞 ， 以 及 调用 


_ str_ 可 根据 使 用 场合 返回 各 种 形式 的 字符 串 ， 例 如 需要 时 间 的 ， 可 返回 时 间 格 式 的 字 


符 串 。 下 面 是 一 个 返回 IP 地 址 的 例子 。 


>>> class IP(object): 
def init (self; a,b,c,d) : 
self.a =a 
self.b-b 
self.c=c 
self.d=d 
def repr (self): 
return 'IP(96s,9 os, os, os) o(self.a,self.b,self.c,self.d) 
def str (self): 
return "9s. 96s. Vos. os  'o(self.a,self.b,self.c,self.d) 
>>> t-IP(192,168,1,1) 
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t 
IP(192,168,1,1) 
>>> print (str(t)) 
192.168.1.1 

>>>t._ repr () 
'IP(192,168,1,1)' 
>>>t str () 
192.168.1.1" 


上 例 中 如 果 未 重新 定义 ”str ， 那 么 _str 的 返回 值 与 _repr 相同 。 


>>> class IP(object): 

def init (self, a,b,c,d): 
self.a =a 
self.b=b 
self.c=c 
self.d=d 

def repr (self): 
return 'IP(96s, 6s, os, os)' Yo(self.a,self.b,self.c,self.d) 


>>> t-[P(192.168.1.1) 
SyntaxError: invalid syntax 
>>> t-[IP(192,168,1,1) 
>>> t._ repr () 
'IP(192,168,1,1)' 

>>>t str () 
'IP(192,168,1,1)' 


Python 的 实例 在 默认 情况 下 是 不 能 像 函数 一 样 调用 的 。 但 如 果 在 类 定义 时 重 载 了 
_ call 函数， 则 类 的 实例 就 是 可 调用 的 ， 调 用 实例 对 象 等 同 于 调用 _call_() 方 法 。 下 面 的 
代码 中 实例 调用 时 参数 为 子 网 掩 码 ， 返 回 值 为 子 网 网 络 号 。callable0 函 数 用 来 判断 一 个 对 象 
是 否 可 通过 函数 操作 符 〔( 圆 括号 ) 调用 。 如 果 可 调用 ， 返 回 True, FURE False， 即 重 载 
cal 的 类 实例 ， 调 用 callable0 函 数 ， 将 返回 True, SURE] False。 本 例 已 重 载 
. call _ ， 故 返回 True, 


m 


>>> class IP(object): 
def init (self, a,b,c,d) : 
self.a =a 
self.b-b 
self.c=c 
self.d=d 
def repr (self): 
return 'IP(96s, 9s, os, os) o(self.a,self.b,self.c,self.d) 
def str (self): 
return "9s. 96s. Vos. os  'o(self.a,self.b,self.c,self.d) 
def call (self, *args,* *kwargs) : 
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return — self.a&args[0],self.b&args[1 ],self.c&args|[2 ],self.d&args[3] 


>>> g-[P(192,168,100,10) 
>>> print (a) 
192.168.100.10 

>>> callable(a) 

True 

>>> a(255,255,0,0) 

(192, 168, 0, 0) 


X 7-3 给 出 了 类 的 特殊 方法 说 明 。 


表 7-3 类 的 特殊 方法 


Ù ”法 ü. — UJ 

is AU D B dons 《构造 )。 如 i —new 返回 cls 的 实例 ， 那 么 _ init_ 被 调用 ， 并 将 _new_ 的 剩 
VIT 余 参数 传递 给 _init . TU init 不 被 调 
. init (self, args) 实例 初始 化 〈 在 构造 时 ) 
. del (self) 被 调用 的 对 象 消失 (引用 计数 为 0) 
. repr (self) repr); ^.^. 转换 
str (self) st() 5 print 语句 转换 
. emp (selfother) 比较 self 与 other， 并 返回 <0, 0, 或 者 20. KI >, <,== 等 
. index (self) 允许 用 任何 对 象 作为 整数 下 标 〈 例 如 为 切片 )。 必 须 返回 一 个 整数 或 者 长 整数 值 
. lt (self, other) 调用 self < other 比较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. le (self, other) 调用 self <= other 比较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. gt (self, other) 调用 self> other 比较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. ge (self, other) 调用 self>=other 比较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. eq (self, other) 调用 self==other 比较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. ne (self, other) 调用 self != other (与 self <> other) 比 较 。 可 能 返回 任何 值 ， 或 者 抛 出 一 个 异常 
. hash (self) 定义 对 类 的 实例 调用 hashO 时 的 行为 ， 返 回 一 个 整数 
. nonzero (self) 定义 对 类 的 实例 调用 boolO 时 的 行为 
. getattr (self;name) 当 属 性 查找 没 找到 name 时 调用 它 。 参 见 _ getattribute ` 
. getattribute  ( self, name) 同 — getattr _ 。 但 是 只 要 属性 名 被 访问 ， 就 一 直 调 
. setattr (self name, value) 当 设 置 属性 时 被 调用 内部， 不 使 用 "selfname = value", F"self. dict [name] = value") 
. delattr (self, name) 删除 属性 <name> 时 调 
. call (self, *args, **kwargs) 实例 作为 函数 调用 时 调 


除了 表 7-3 中 的 特殊 方法 ，Python 还 支持 一 些 运 算 符 的 重 载 ， 例 如 : 


>>> class C(object): 
def init (self, v): 
self.value-v 
def add (self,r): 
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return | sel£.value*r 
>>> a-C(10) 
>>> at] # 相 当 于 调用 a. add (1) 
11 


1.4 继承 


在 面向 对 象 的 程序 设计 中 ， 继 承 〈Inheritance) 允许 子 类 从 父 类 那里 获得 属性 和 方法 ， 


同时 子 类 可 以 添加 新 方法 或 者 重 载 其 父 类 中 的 任何 方法 。 在 Python 中 定义 继承 类 的 语法 格 


式 是 : 


class <name>(Superclass, superclass, ...) 


suit 


子 类 继承 父 类 具有 如 下 特征 : 


(1) 如 子 类 未 重 载 父 类 的 方法 和 属性 ， 子 类 的 实例 将 调用 父 类 的 方法 和 属性 。 


下 例 


Cch7-4.py) 中 的 ee 以 及 testb.FakeOnlyAO 对 selfa 的 调用 演示 了 该 特性 。 
(2) 如 子 类 重 载 了 父 类 的 方法 会 存在 两 种 情况 ， 一 种 类 似 于 ch7-4.py 的 


CommonAB Cover(0) 方 法 ， 子 类 通 过 重 载 将 父 类 的 CommonAB Covert k m. ERPI 
调用 父 类 的 CommonAB_Cover0 方 法 ; 一 种 类 似 于 ch7-4.py 中 的 CommonAB NoCover077 


法 ， 子 类 重 载 该 方法 时 ， 通 过 super0 调 用 父 类 的 CommonAB_NoCover0 方 法 ， 并 添加 了 新 
的 内 容 。testb.CommonAB = 结果 表明 基 类 的 CommonAB Cover0 并 没有 被 调用 。 


testb.CommonAB NoCover0 的 运行 结果 表明 基 类 的 CommonAB_NoCover0 首 先 被 调用 ， 然 


后 调用 子 类 的 相应 部 分 。 
下 面 看 看 ch7-4.py 的 代码 。 


class A(object) : 
def OnlyA (selfaa): 
self.a-a 
print ("Only A :%s"%self.a) 
def CommonAB Cover(self;ab1): 
self.ab1=ab1 
print ("CommonAB InA:%s"%self.ab1) 


def CommonAB NoCover(self;ab2): 
self.ab2-ab2 
print("CommonAB No Cover in A :%s"%self.ab2) 


class B(A): 
def CommonAB Cover(self;ab1): 
self.ab1—ab1--10 
print("CommonAB Cover in B:%s" V oself.abl) 
def CommonAB NoCover(self;ab2): 
#super( ).CommonAB NoCover(ab2) 
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super(self. class _ ,self}.CommonAB NoCover(ab2) 

print("CommonAB No Cover in B :%s"%self.ab2) 
def OnlyB(self)b): 

self.b-b 


print("only B :%s"%self.b) 
def FakeOnlyA(self): 
self.a- 10*self.a 
print ("OnlyA Fake inB:%s" %self.a) 


testb-B() 


testb.OnlyA(1) 
testb.CommonAB Cover(2) 
testb. CommonAB NoCover(3) 
testb.OnlyB(4) 
testb.FakeOnlyA( ) 

print (eee Ny is JA sd) 
testa-A() 

testa.OnlyA(10) 

testa.CommonAB Cover(20) 
testa.CommonAB NoCover(30) 
testa.OnlyB(40) 
testa.FakeOnlyA( ) 


运行 结果 如 下 : 


Only A :1 

CommonAB Cover in B:12 

CommonAB No Cover in A :3 

CommonAB No Cover in B :3 

only B :4 

OnlyA Fake inB:10 

Akoko kN Ow is ACE eee ek 

Only A :10 

CommonAB InA:20 

CommonAB No Cover in A :30 

Traceback (most recent call last): 

File "C:/Python34/adsf. py", line 43, in «module 

testa.OnlyB(40) 

AttributeError: 'A' object has no attribute 'OnlyB' 


一 般 子 类 的 _init 采用 CommonAB NoCover 的 方式 ， 显 式 调 用 基 类 的 _init AŽ 
从 Python 3 开始 可 直接 调用 super0.， init (self...) 方 式 。 为 了 保证 代码 在 Python 2 与 Python 
3 中 兼容 ， 推 荐 使 用 super(self. class self). init (self...)。 如 果子 类 是 多 重 继承 ， 而 子 
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类 又 没有 自己 的 构造 函数 时 ， 则 按 顺 序 继 承 ， 哪 个 父 类 在 最 前 面 且 有 自 
就 继承 哪个 的 构造 函数 ， 如 果 第 一 个 父 类 没有 构造 函数 ， 则 继承 第 二 个 的 构造 函数 ， 
此 类 推 。 

模板 设计 模式 是 一 种 基于 继承 的 代码 复 用 模式 ， 是 由 (抽象 〉 基 类 定义 逻辑 流程 框架 
体 的 逻辑 内 容 由 子 类 来 实现 ， 但 处 理 流程 由 父 类 确定 。 

下 面 代 码 中 的 start, run, stop 方法 通过 异常 (raise TypeError) 限制 了 父 类 在 子 类 中 必 
须 重 载 实现 ， 否 则 调用 父 类 的 相应 方法 会 报错 。testVehicle 是 模板 方法 (template method), 
子 类 中 无 需 重 载 ， 是 本 例 Cch7-5.py) 中 Vehicle 以 及 其 子 类 对 外 提供 的 唯一 调用 接口 。 


class Vehicle(object): 
def init (self, speed): 
self.speed=speed 
def start(self) : 
raise — TypeError('abstract method must be overridden") 
def run(self) : 
raise TypeError("abstract method must be overridden") 
def stop(self) : 
raise TypeError("abstact method must be overridden") 
def testVehicle(self) : 
self.start() 
self.run() 
self.stop() 
class Car(Vehicle) : 
def init  (self,speed): 
super(self. class self) init (speed) 


def start(self ): 

print("incar start") 
def run (self) : 

print ( "car speed is Vos" ?o(self.speed) ) 
def stop(self) : 


print ("car stop" ) 
class Truck (Vehicle) : 


def init  (self,speed): 
super(self. class self) init (speed) 


def start(self ): 

print("in Truck start") 
def run (self) : 

print ( "Truck speed is Vos" ?o(self.speed) ) 
def stop(self) : 


print ("Truck stop" ) 


## 调用 
Vehicletest1—Car(100) 
Vehicletest2-Truck(90) 
Vehicletest1.testVehicle() 
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print (HPK) 


Vehicletest2.testVehicle() 


运行 结果 如 下 : 


incar start 

car speed is 100 

car stop 
LLLELLLELELLLLLLLLII 
in Truck start 
Truck speed is 90 
Truck stop 


本 例 不 仅 演 示 了 模板 设计 模式 ， 而 且 演 示 了 Python. 方法 /属性 继承 关系 ， 


异常 限制 基 类 中 


系 ， 该 函数 可 以 判断 一 个 类 是 否 为 男 外 


issubclass(sub,sup) 


以 及 如 何 通 过 


PH 子 类 必须 重 载 的 方法 。Python 提供 issubclass0 函 数 判断 子 类 / 父 类 之 间 的 关 
个 类 的 子 类 或 子孙 类 ， 用 法 如 下 : 


如 果子 类 sub 为 sup 的 一 个 子 类 则 返回 True。 其 中 sup 可 以 为 父 类 组 成 的 元 组 ， 只 要 


sub 为 该 元 组 ， 


>>> class Foo(object): 
pass 

>>> class Foo2(object) : 
pass 

>>> class Bar(Foo): 


pass 


>>> issubclass(Bar,Foo) 


True 


>>> issubclass(Bar,(Foo,Foo2) ) 


True 
>>> issubclass(Bar,object) 


True 


19 多 态 


多 态 是 指 一 个 父 类 的 引用 变量 可 以 指向 不 同 的 子 类 对 象 ， 并 且 在 运行 时 根据 父 类 引用 变 


量 所 指向 对 象 的 实际 类 型 执行 相应 的 子 类 方法 。C1 
久子 类 型 语言 ， 不 能 用 instance) 
]， 除 了 通常 所 说 的 磁盘 文件 ， 

write 函数 ， 所 以 都 可 以 作为 类 文件 进行 使 月 


但 Python 是 一 种 
个 典型 的 多 态 应 


read、 


的 某 一 个 类 的 子 类 ， 即 返回 True. issubclass 的 用 法 如 下 。 


下 面 (ch7-6.py〉 是 一 个 多 态 


还 是 wolf。 
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H+ 通过 virtual 的 晚 绑 定 机 人 


BSEC Y Z 


WHER” L 7.3.1 小 节 )。 类 文件 是 一 


I 


他 的 StringIO 和 BytesIO 


H. 
法 ， 即 barkform 直到 执行 时 ， 才 决定 被 调用 对 象 是 dog 


因为 都 包含 了 


class wolf(object): 
def bark(self): 
print "hooooowll" 


class dog(object): 
def bark(self): 
print "woof" 


def barkforme(dogtype): 
dogtype.bark() 


my dog = dog() 

my wolf- wolf() 
barkform(my dog) 
barkform(my wolf) 


16 可 见 性 


面向 对 象 的 特点 之 一 是 3 
日 这 些 方 法 ， 这 些 方法 被 封装 后 ， 将 
的 内 部 ， 只 能 够 看 到 自己 可 月 
private [EE T JEH 
protected, private 关键 字 ， 所 有 


分 使 月 


的 方法 。C 
E 或 者 方法 只 和 


时 性 和 方法 都 是 共有 和 


时 装 。 一 些 方法 创建 后 ， 上 只 在 类 内 部 使 用 ， 不 希望 程序 的 其 他 部 
` 会 被 “外 部 消费 ”。 
+, Java 提供 了 专门 封装 的 关键 字 : private, EH 
EB 在 类 中 被 访问 。 但 在 Python 对 象 模型 中 ， 没 有 public. 
的 ， 也 就 是 说 数据 没有 做 相应 的 保护 ， 


封装 使 程序 员 忽略 操作 对 象 


你 可 以 在 任何 地 方 对 它们 进行 任意 修改 。 但 Python 有 类 封装 的 语法 ， 这 就 是 所 谓 的 name 


mangling， 即 在 定义 类 时 ， 如 果 一 个 属 羽 


的 名 称 是 以 两 个 下 画 线 


始 ， 同 时 又 不 是 以 下 画 线 


结束 的 ， 那 么 它 在 编译 时 将 自动 被 改写 为 类 名 加 上 属性 名 。 在 类 外 部 使 用 该 属性 名 称 时 ， 会 
提示 找 不 到 。 例 如 : 


class Person(object): 

def init (self): 
self.A="name" 
self. B-"age" 
self. C ="id" 

def Print(self): 
print (self.A) 
print (self B) 
print(self. C ) 


>>> p-Person() 
>>> p.A 


'name' 
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>>> p G 
'id' 


>>>p. B 


Traceback (most recent call last): 
File "<pyshell#17>", line 1, in «module 


p. B 


AttributeError: 'Person' object has no attribute '_ B' 


>>> p.Print() 
name 

age 

id 


直接 访问 p. B, 出 现 了 AttributeError。 实 际 上 可 通过 object. Class. method. 方式 访问 


_B， 如 下 面 的 代码 可 以 


Person B 属性 。 


>>>p. Person. B 
' 1 


age 
2p. dict | 


{'A': 'name',' C "':'"id,' Person 


B': 'age'} 


综 上 所 述 ，Python 的 私有 方法 不 是 真正 的 私有 ， 


Ji, xp "A 


E 常 访问 _B 属性 。 通 过 _dict 查看 实例 属性 ， 确 实 存在 


保护 ”的 方法 可 以 被 


子 类 继承 /关联 (名 称 空间 不 被 污染 ); 另 一 方面 ， 当 使 


找 不 到 该 对 象 。 


] dir KAAR 


7.7 Python 类 中 的 属性 


Python 中 除了 静态 方式 ， 即 通过 点 号 直接 访问 属性 ， 还 有 几 种 动态 访问 属性 的 方法 : 方 


AER 〈 即 重 载 _getattr 


` 


Setattr 、 


(有 时 又 称 “ 特 性 ”) 和 


管理 自 定义 类 
访问 的 属 


setattr 、 


的 值 ， 该 方法 都 会 调 


获取 它 


截 所 有 的 属性 删除 。 
注意 : 在 Python ! , 


是 说 ， 你 可 以 针对 一 个 类 或 类 实 


那么 _getattr_ 永远 不 会 被 调 
新 式 类 和 Python 3 的 所 有 类 中 ; _ setattr “方法 将 拦 


一 个 类 或 类 实例 中 的 属性 是 动态 的 
网 添加 或 删除 一 个 属性 。 


1», 所 以 ， 当 一 个 类 


同时 本 


如 果 我 们 想 使 用 这 类 方法 


一 个 对 象 时 ，dir 函数 


delattr 和 getattribute 2. property 内 置 函数 
述 符 协议 (descriptor)。 
在 Python F, *EZX getattr 、 
Bg EUR]. Hu 


delatr 和 getattribute 方法 可 以 用 来 
，_ getattr 方法 将 拦截 所 有 未 定义 的 属性 获取 〈 即 当 要 
性 已 经 定义 时 ， 该 方法 不 会 被 调用 ， 至 于 定义 不 定义 ， 是 | 
属性 来 决定 的 ); _ getattribute | 方法 将 拦截 所 有 属性 获取 无 论 该 属性 是 否 已 经 定义 ， 只 要 
EdX f  getatr 和 getattribute ` 
Jo ^h.  getattribute “方法 仅仅 存在 于 Python 2.6 的 
BUT HJ) PEWUEEE 


Python 能 和 否 查找 到 该 


; _ delattr 方法 将 拦 


因为 Python 是 动态 的 )， 也 就 


即 重 载 操 作 符 ) 来 管理 
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中 重新 定义 这 些 方法 的 实现 。!1 
性 进行 拦截 ， 所 以 ， 在 重 载 它们 时 ， 要 六 


定义 类 的 属性 ， 就 需要 在 自 定义 类 
delattr 方法 对 所 有 的 属 


于 getattribute ~ _ setattr 、 
E 意 避免 递归 调 


用 《如 果 出 现 递 归 ， 则 会 引起 死 循 


»* 
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环 )， 然 而 对 _getattr “方法 ， 则 没有 这 人 么 多 限制 。 

. getattr — (self, name) 可 查询 即时 生成 的 属性 。 当 我 们 查询 一 个 属性 时 ， 如 果 通 过 
_dict 方法 无 法 找到 该 属性 ， 那 么 Python 会 调用 对 象 的 _getattr 方法 即时 生成 该 属性 。 
例如 ( 源 代码 为 ch7-7.py) : 


#-*- coding:utf-8 -*- 
class Person(object): 
def init (self, id): 
self.id — id 


Ez 


a" Hui Xm 
def  getattr (self,myattr ): 
print (u" dict ”中 无 %s 属性 ,不 过 ”getattr_ 可 以 假装 它 有 "%myattr) 


if myattr == name': 


PEEB diet ”中 不 包含 的 。 " 


self.name-"default" 
print (u" 添 加 了 个 name 属性 ") 


return self.name 


else : 
print (u" 但 确实 无 %s 属性 "%myattr) 
return None 


m 


def _ setattr (selfattr,value): 
#object. setattr (self, name, value) 
#print "in  setattr" 


#print name 


if attr =='age': 

print ("age " ) 

self. dict [attr|-value 
else : 

raise AttributeError 


def  delattr (selfattr) : 
object. delattr (self,attr) 


m 


mytest=Person(10) 

print (mytest.id) 

print(mytest. dict ) 

print mytest.age 

print mytest.name 

print(mytest. dict )&/SJH Y name 属性 ， 但 没有 添加 age 属性 
mytest.age-30 


Hl 


Um 


mytest.name-"test" 
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print(mytest. dict ) 


该 程序 的 运行 结果 如 下 。 


10 
fid: 10) 
. dict 中 无 age 属性 ,不 过  getatr _ 可 以 假装 它 有 
但 确实 无 age 属性 
None 
_dict_ 中 无 name 属性 ,不 过 ”getattr_ 可 以 假装 它 有 
添加 了 个 name 属性 
default 
{'id': 10, 'name": 'default'] 
{'age': 30, 'id': 10, "name": 'test'] 
30 
可 以 看 出 ， 访 问 _dict_ 中 不 包含 的 属性 时 ， 通 过 getattr ”伪装 了 实例 包含 该 大 
装 后 如 何 收尾 ， 就 需要 看 _getattr_ 的 定义 了 。 
_setattr _ 会 拦截 所 有 属性 的 赋值 语句 ， 如 果 定 义 了 该 方法 ，self.attr=value 会 变 成 
self._setattr(attr,value)。 因 为 通过 ”setattr _ 对 任何 self 属性 赋值 ， 都 会 重新 调用 _setattr _， 
容易 导致 无 穷 递归 。 因 此 _setattr_ 的 实现 需 采 用 修改 属性 字典 的 方法 ， 而 不 是 self. dict - 
的 方式 。 为 Person 类 添加 如 下 代码 ; 


wl 
= 


性 ， 伪 


def ^ setattr (self,attr,value): 
print(u" JH _ setattr 给 %s 属性 赋值 ，%s"%(attr,value)) 
self. dict [attr]=value 


则 mytest.age-30 与 mytestname="test" 两 名 的 运行 结果 变 为 : 


通过  setatr 给 age 属性 赋值 : 30 
通过  setatr Z5 name 属性 赋值 : test 


下 面 是 通过 getattr 以 及 重 载 _getattr_ 实 现 的 代理 模式 。 代 理 (Proxy) 设计 模式 是 一 种 
常用 的 设计 模式 ， 它 主要 用 来 通过 一 个 对 象 〈 例 如 B) 给 另 一 个 对 象 〈 例 如 AO 提供 “ 代 
理 ” 的 方式 访问 。 如 A 对 象 不 方便 直接 引用 ， 代 理 B 就 在 A 对 象 和 访问 者 之 间 做 了 中 介 ， 
以 控制 对 A 的 访问 ， 将 真正 的 功能 对 象 A 隐藏 起 来 。 代 码 中 ， 将 personl 类 作为 Proxy 的 实 
例 化 参数 。 


class Proxy(object) : 
def init (self,subject): 
self. subject-subject 
# 
def  getattr (self,attr): 
return — getattr(self. subject, attr) 


proxy-Proxy(person1) 
print person .Home() 
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18 高 级 话题 : 抽象 基 类 


Python 的 abc 模块 提供 了 定义 抽象 基 类 (Abstract Base Calsses) 的 方法 。 抽 象 基 类 是 
种 为 其 子 类 定义 了 一 组 公共 接口 的 类 ， 这 些 接口 ， 子 类 必须 加 以 实现 。 与 抽象 基 类 密切 相关 
的 一 个 概念 是 元 类 。 元 类 更 像 “ 类 工厂 ” 返回 对 象 是 类 。 

type 函数 可 动态 地 创建 类 。type 可 以 接受 一 个 类 的 描述 作为 参数 ， 然 后 返回 一 个 类 。 
type 创建 类 的 语法 格式 如 下 : 


例如 


函数 type 实际 上 是 一 个 元 类 ， 也 就 是 用 于 创建 所 有 类 的 类 。 可 以 通过 检查 ”class ”属性 


Tm 


type( 类 名 ， 父 类 的 元 组 〈 针 对 继承 的 情况 ， 可 为 空 )， 包 含 属性 的 字典 《名 称 和 值 ) ) 
通过 如 下 语句 可 创建 一 个 str 的 子 类 : 


>>> mystr=type("mystr",(str,),dict(x=1,a="abc")) 
>>> testl=mystr("test str") 
>>> print (test1) 


test str 

>>> type (test1) 

<class' main .mystr> 
>>> testl.x 

1 

>>> testl.a 

'abc' 


>>> dir(testl) 
[. add ',' class '' contains ',' delattr ',' dict ',' dir '," doc ',' eq ',' format ', 


1 


UNE UNT UNT UNE 1 


ge ',' getattribute ',' getitem ',' getnewargs ',' gt ',' hash ',' init ',' iter ',' le ， 


1 1 1 1 UNT ' 1 E 1 1 


len ',' lt '' mod ',' module ',' mul ',' ne ',' new '' reduce '' reduce ex ' 


1 | ' 1 1 1 1 Poy ' 1 ta! 


repr. ',' rmod ',' rmul ',' setattr ',' sizeof ',' str ',' subclasshook ',' weakref ','a, 


'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', format map', 'index', 
'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric'" '"isprintable', 'isspace', 'istitle', 'isupper', 
'join', 'ljust', "lower', 'Istrip', 'maketrans', 'partition', replace", 'rfind', 'rindex', 'rjust', rpartition', 'rsplit', 'rstrip', 
'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'x', 'zfill'] 

>>> testl.upper() 

TEST STR' 


来 看 到 这 一 点 。 注 意 ，Python 中 所 有 的 东西 都 是 对 象 。 而 且 它 们 都 是 从 同一 个 类 创建 而 来 。 
下 面 的 代码 验证 了 这 一 点 : 


>>> class F(object):pass 
>>> a-F() 

>>>8a class . 

<class' main .F'> 
>>>(a. class ). class 
«class 'type 

>>> b-"test str" 
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>>>b. class - 
«class 'str'> 
>>> (b._ class ). class 


«class 'type 
类 的 另 一 属性 是 _metaclass “属性 。 如 果 在 创建 类 时 未 指定 类 的 _metaclass ”属性 ， 则 
该 类 是 由 type 创建 的 ;否则 是 由 _metaclass “属性 值 创 建 的 。 下 面 的 源 代 码 Cch7-8.py) 通过 
MyMeta 元 类 创建 了 MyClass. 


in 
[in 


from time import ctime 
class MyMeta(type): 
def init (cls,name,bases,dic): 
print ("in MyMeta") 
print ("Vos created at Vos" ?o(cls. name  ,ctime())) 


class MyClass(object): 
. metaclass = MyMeta 
def init (self): 
print ("MyClass init") 


tt-MyClass() 


Python 3 的 元 类 语法 有 所 改变 : 


from time import ctime 
class MyMeta(type): 
def init (cls,name,bases,dic): 
print ("in MyMeta") 
print ("Vos created at Vos" Vo(cls. name  ,ctime())) 
class MyClass(metaclass - MyMeta): 
def init (self): 
print ("MyClass init") 


tt-MyClass() 


abc 模块 中 有 两 个 装饰 器 (@abstractmethod 与 @abstractproperty) 用 于 定义 抽象 方法 与 
抽象 属性 。 下 面 是 abstractmethod 与 abstractproperty 的 使 用 方法 。 在 抽象 基 类 A 中 定义 了 
Printitem， 如 果 在 B 中 没有 定义 Printitem， 将 返回 TypeError: Can't instantiate abstract class B 
with abstract methods Printitem。 即 所 有 在 抽象 基 类 中 通过 abstractmethod 与 abstractproperty 
定义 的 方法 、 属 性 均 需 要 在 继承 类 中 重新 定义 ， 否 则 会 抛 出 异常 。 


from abc import ABCMeta,abstractproperty,abstractmethod 
class A(object): 
. metaclass = ABCMeta 
@abstractmethod 
def Printitem(self): 
pass 
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def get item(self): 
pass 
defset item(self, value): 


pass 


item — abstractproperty(get item, set item, doc 


class B(A): 
def init (self): 
self. item-0 
def Printitem(self): 
print self. item 


defget item(self): 


return self. item 


defset item(self, value): 


self. item-value 


ra 


"rt 或 返回 item") 


item = property(get item, set item, doc="1Z' 


test1 -B() 
test1.item-10 
print(test1.item) 
testl.Printitem() 


或 返回 item") 


下 面 (ch7-9.py〉 是 抽象 基 类 实现 多 态 特 性 的 方法 ， 通 过 该 方法 限定 了 所 有 继承 者 都 需 


实现 抽象 基 类 定义 的 抽象 方法 和 抽象 属性 。 


class Shape(object):#(metaclass=ABCMeta): 
. metaclass —ABCMeta 
def area(self): 
pass 
class Circle(Shape): 
def init (self, radius) : 
self.radius-radius 
def area(self): 
return — 3.14*self.radius*self.radius 


class Rectangle(Shape) : 
def init (self,a,b): 
self.a-a 
self.b-b 
def area(self): 
return | self.a*self.b 
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def PrintArea(obj): 
print (obj.area() ) 
mytest1—-Circle(2) 
mytest2-Rectangle(2,3) 
PrintArea(mytestl) 
PrintArea(mytest2) 


19 小 结 


Python 中 一 切 皆 对 象 ， 程 序 员 可 以 创建 从 long. list 继承 的 子 类 。 但 又 


于 Python 属 


动态 语言 ， 使 得 其 对 象 属性 可 以 动态 修改 ， 具 有 比 C+HJava 更 灵活 的 特性 
例 的 _dict “或 通过 attr* 方 法 查看 /添加 属性 。 类 本 身 也 是 对 象 ， 可 通过 元 类 
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。 可 以 通过 类 / 


将 


第 8 章 数据 库 


数据 库 是 持久 化 数据 的 常用 方式 。 由 于 SQL 型 数据 库 历 史 和 悠久 、 技 术 人 员 众 多 、 非 常 
可 靠 ， 因 此 本 章 主要 讲解 Python 与 型 数据 库 的 交互 。 首 先 结合 SQLite 介绍 了 Python 
的 数据 库 规 范 (DB-API 2.0)， 然 后 介绍 使 用 相应 的 Python 包 访 问 PostgreSQL 与 MySQL. 
高 级 话题 是 关于 ORM 的 内 容 。 其 中 8.2、8.3、8.4 以 及 9.3 节 使 用 了 相同 的 todo 表 ， 方 便 读 
者 比较 各 自 的 使 用 方法 。 


8.1 DB-API2.0 


Python 的 DB-API 2.0 是 一 个 规范 。 它 定义 了 一 系列 必需 的 对 象 和 数据 库存 取 方 式 ， 
以 便 为 各 种 各 样 的 底层 数据 库 系统 和 多 种 多 样 的 数据 库 接 | 一 致 的 访问 接口 。 数 
据 库 均 有 对 应 的 符合 DB-API 规范 的 数据 库 接口 ， 程 序 员 使 用 接口 连接 各 数据 库 后 ， 就 可 
以 用 相同 的 方式 操作 各 数据 库 ， 增 强 了 代码 一 致 性 和 移植 性 。 目 i Python 支持 的 主要 数据 
库 如 下 : 

€ Oracle 
SQL Serve 
MySQL 
SQLite 
PostgreSQL 

€ Gadfly 

€ Access 

DB-API 2.0 接口 定义 了 Python 访问 数据 库 的 规范 ， 主 要 包含 : 模块 属性 、 连 接 对 象 、 
游标 对 象 、 类 型 对 象 和 构造 器 。 

下 面 以 SQLite 为 例 ， 说 明 DB-API 接口 的 主要 内 容 。SQLite 是 一 款 轻 型 的 数据 库 ， 目 
已 经 嵌入 到 Python 发 行 包 中 。Sqlite3 模块 由 Gerhard Häring 编写， 提供 了 一 个 SQL 接 
口 ， 这 个 接口 的 设计 遵循 了 由 PEP 249 描述 的 DB-API 2.0 说 明 书 。 
DB-API 2.0 关于 模块 属性 的 定义 ， 主 要 有 apilevel、threadsafety、connect0 和 paramstyle. 
apilevel 表示 支持 的 DB-API2.0 接口 版 本 ; threadsafety 表示 线程 安全 级 别 ; connect) 
来 生成 connect 对 象 ， 用 于 访问 数据 库 ; paramstyle 表示 支持 的 SQL 参数 风格 。 例 如 : 


< 
< 


Zom 


>>> import sglite3 

>>> print sglite3.apilevel 
2.0 

>>> sglite3.threadsafety 
1 
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>>> sglite3.paramstyle 
'qmark' 


sglite3.apilevel 的 值 为 2.0， 说 明 sglite3 支持 DB API2.0. sglite3.threadsafety 返回 值 为 


1， 表 示 初 级 线程 支持 ， 线 程 可 共享 模块 ， 但 不 可 共享 连接 。sgqlite.paramstyle 返回 值 为 


qdmark， 表 示 问 号 
虽然 各 个 数据 库 接口 都 表示 支持 DB-API 2.0, 


风格 ， 即 “where name =?” 的 方式 。 


但 一 些 地 方 并 不 完 


就 是 最 典型 的 。 在 PEP249 中 给 出 了 connect 方法 的 参数 ， 见 表 8-1. 


表 8-1 DB-API2.0 的 connect0 方 法 参数 


全 一 样 ，connect0 方 法 


dsn 数据 源 字符 串 

user 户 名 字符 串 《〈 可 选 ) 
password 密码 字符 串 〈 可 选 ) 
host EHE T) 
database 数据 库 名 《可 选 ) 


串 ， 该 字符 串 包 含 了 数据 名 、 数 据 库 用 户 、 数 据 库 主 机 的 信息 。 
下 面 分 别 就 MySQL (MySQLdb Ë 
说 明 connect 不 同 之 处 。 


字 参 数 ,根据 数据 库 选 用 不 同 参数 。 
(psycopg2 接口 )、SQLite 3 的 数据 库 接 口 
连接 MySQL 的 格式 如 下 : 


使 用 过 ADO 或 者 ADO.NET 的 人 ， 会 很 熟悉 dsn 字符 串 。 数 据 库 连接 使 用 dsn 字符 
S 


的 其 他 参数 为 关键 


K 8-1! 


PS 


Conn = MySQLdb.connect(host-" EHL", db=" 数 ] 
用 户 密码 ") 


这 里 需要 注意 的 是 密码 参数 是 passwd， 不 是 password; 数据 库 名 参数 使 用 的 是 db. IH 


不 是 DB-API 2.0 中 规定 的 database. 字符 串 。 


BEZIRK", user=" 数 ] 


"FER 


). PostgreSQL 


户 名 ", passwd=" 数 据 库 


psycopg2 是 PostgreSQL. 的 数据 库 接口 。 其 连接 方式 有 两 种 ， 一 种 是 dsn 方式 ， 一 种 是 


关键 字 参 数 方式 。 两 种 方式 的 定义 如 下 : 


psycopg2.connect(dsn, connection factory=None, cursor factory-None, async=False) 


psycopg2.connect(**kwargs, connection factory=None, cursor factory=None, async=False) 


dsn 的 使 用 方式 例 程 如 下 : 


conn = psycopg2.connect("dbname=testdb user-postgres password=secret")# 使 用 


库 ， 而 不 是 database。 


使 用 关键 字 参 数 方式 的 例 程 如 下 : 


psycopg2.connect(database="testdb", 
port="5432") 央 使 用 database 表示 数 ] 


SQLite 3 的 数据 库 连接 格式 为 : 
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user="postgres", 
WEE, ， 而 不 是 dsn 中 的 dbname 


password-" 123456", 


dbname 标识 数据 


host-"127.0.0.1", 


数据 库 


ES 
oo 
de 


sqlite3.connect(database [,timeout ,other optional arguments ]) 
例如 : 
conn = sqlite3.connect('test.db') 


Sqlite 与 其 他 数据 库 的 区 别 是 ， 如 果 test.db 数据 库 不 存在 ， 将 自动 创建 

通过 模块 的 connect 方法 创建 了 连接 对 象 后 ， 可 以 对 数据 进行 操作 ， 执 行 连接 对 和 象 的 
commitO 函 数 提交 当前 事务 以 及 通过 rollbackO 函 数 撤销 当前 事务 ， 并 可 通过 连接 对 象 执 行 
cursor0 函 数 创建 游标 。 

游标 用 于 执行 数据 库 命 令 和 执行 查询 ， 并 读 取 查询 结果 。 下 面 以 Sqlite 3 为 例 说 明 
连接 对 象 与 游标 的 常用 方法 。 主 要 过 程 是 建立 连接 对 象 ， 通 过 连接 对 象 建立 游标 ， 然 后 
通过 游标 的 execute)JA4T SQL 语句 ,通过 游标 的 fetchall 读 取 SQL 的 Select 命令 执行 
结 


FH 
N o 


o 


#!/usr/bin/python 
#encoding=utf-8 


import sqlite3 
conn=sqlite3.connect(":memory:")#conn = sqlite3.connect(r'd:Vestdb.db') 
cur=conn.cursor() 
cur.execute("CREATE TABLE User 
(ID INT PRIMARY KEY NOT NULL, 


NAME TEXT NOT NULL, 

AGE INT NOT NULL, 

ADDRESS CHAR(50), 

SALARY REAL)" # 可 直接 用 conn.execute 


cur.execute("INSERT INTO user (ID,NAME,AGE,ADDRESS,SALARY) \ 
VALUES (1, ' 中 文 , 32, ' 大 连 ', 20000.00 )") # 可 直接 用 conn.execute 
cur.execute("insert into user (IDDNAME,AGE)values(?,2,2)" ,(2,u" 中 文 名 " ,23)) 


conn.commit() 


cur = cur.execute(" SELECT id, name, address, salary from User") 
for row in cur.fetchall(): 

print "ID — ", row[0] 

print "NAME = ", row[1] 

print "ADDRESS = ", row[2] 

print "SALARY = ", row[3], "n" 
conn.close() 


DB-API 对 数据 库 的 基本 操作 流程 可 概括 为 下 面 几 步 ; 
D 建立 连接 对 象 。 

2) 通过 连接 对 象 建立 游标 。 

3) 通过 游标 的 execute0 执 行 各 类 SQL 语句 。 
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4) 通过 游标 的 fetchall0 读 取 Select 语句 的 返回 结果 。 
上 述 代码 中 给 出 了 连接 对 象 和 游标 对 象 的 用 法 ， 连 接 对 象 将 SQL 命令 发 送 给 服务 器 并 
读 取 从 服务 器 返回 的 数据 ， 主 要 方法 及 功能 描述 见 表 8-2。 


表 8-2 连接 对 象 方法 


方 法 名 功能 描述 
close 关闭 连接 
commit 提交 事务 
rollback 取消 当前 事务 
cursor 使 用 连接 创建 并 返回 一 个 游标 


游标 对 象 允 许 用 户 执行 数据 库 命令 并 获取 碍 询 结果 ， 对 象 的 方法 和 属性 见 表 8-3。 


T 


表 8-3 游标 对 象 的 方法 和 属性 


方法 /属性 功能 描述 
arraysize 设置 fetchmany() 一 次 取出 的 记录 数目 ， 默 认 值 为 1 
callproc 调 个 存储 过 程 
et 返回 游标 的 状态 (name，type_code，display_size，internal size, precision, scale, null ok)， 该 属性 为 只 读 
p 属性 ， 除 了 name、type_code， 其 余 值 可 能 为 None 
execute 执行 一 个 数据 库 查 询 
executemany 一 次 执行 多 条 SQL 语句 
fetchone 获取 记录 集 的 下 一 行 
fetchmany 获取 查询 记录 集合 ， 函 数 参数 决定 了 获取 行 数 
fetchall 获取 所 有 查询 结果 的 记录 
rowcount 返回 execute0 影 响 的 行 数 


8.2 Psycopg 2 


PostgreSQL 是 一 个 功能 强大 的 开源 对 象 关系 型 数据 库 系 统 。PostgreSQL 能 够 运行 在 所 
有 主流 操作 系统 上 上， 包括 Linux, UNIX (AIX, BSD, HP-UX, SGI IRIX, Mac OS X, 
Solaris, Tru64) 和 Windows。 需 要 注意 的 是 ，PostgreSQL 在 Windows 下 不 能 安装 到 带 有 中 
文 的 目录 下 。 

PostgreSQL 的 Python 接口 主要 有 Psycopg 2、PyGreSQL 和 py-postgresql， 其 中 Psycopg 2 用 
户 群 比较 大 。Windows 下 的 Psycopg 2 的 安装 需要 从 http://www.stickpeople.com/projects/python/win- 
psycopg/ 下 载 软件 包 。Psycopg 2 的 Windows 版 本 根据 Python 版 本 与 Windows 32/64 位 机 进行 划 
分 ， 需 结合 自己 情况 下 载 安装 相应 版 本 。 其 余 操作 系统 请 按照 http;//initd.org/psycopg/docs/install.html 
的 说 明 进 行 安装 。 

Python 与 PostgreSQL 数据 类 型 对 应 关系 见 表 8-4。 
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表 8-4 Python 5 PostgreSQL 数据 类 型 对 应 关系 


Python 的 数据 类 型 PostgreSQL 的 数据 类 型 
None NULL 
bool bool 

real 
< double 
i smallint 
int à 
ong integer 
Š bigint 
Decimal ee 
pir varchar 
unicode text 
buffer 
bytearray byte 
bytes 
date date 
time time 
timetz 
datetime timestamp 
timestamptz 
timedelta interval 
list ARRAY 


下 面 以 todo & (9.2 节 也 使 用 该 表 ) 为 例 ， 说 明 Psycopg 2 的 使 用 方法 。 下 面 代 码 是 创 
EX todo 的 过 程 。conn 为 创建 的 数据 库 连接 ， 使 用 了 9.1 节 说 明 的 关键 字 方 式 〈 需 先 通 过 
pgAdmin 创建 数据 库 test)。cur 为 游标 ， 执 行 数据 库 命 令 和 获取 查询 结果 。 首 先 通过 SOL 的 
Drop 删除 已 有 的 todo 表 ， 然 后 通过 create 语句 创建 todo X. 


ni 


import psycopg2 


conn = psycopg2.connect(database-"test", user-"postgres", password-"postgres", host=" 127.0.0.1", port-" 5432") 
cur = conn.cursor() 
cur.execute("DROP TABLE IF EXISTS todo") 
cur.execute("CREATE TABLE todo 
( 
id serial NOT NULL, 
title character varying(255) NOT NULL, 
posted on date, 
status boolean DEFAULT false , 


DateDue date, 
level integer, 
CONSTRAINT todo pkey PRIMARY KEY (id) 
)") 
创建 todo 表 之 后 ， 通 过 下 面 语句 添加 相应 的 测试 数据 。 可 以 用 execute 或 executemany 


添加 数据 。 
execute 中 直接 使 用 字符 串 形式 表示 SQL 语句 。 
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cur-conn.cursor() 


cur.execute(" INSERT INTO todo (id,title , DateDue ,level) V 


NN 
vi 


VALUES (1, 


É - 
EJ 


ANM "t 
D, 


'2015-12-12', 1)"); 


cur.execute("INSERT INTO todo (id,title , DateDue ,level) V 


VALUES (2, ' 第 二 


AN 
> 


'2015-12-12', 1)"); 


cur.execute("INSERT INTO todo (id,title , DateDue ,level) \ 


EJ 


VALUES (3, ' 


frexecutemany 


第 二 个 ! 


三 个 ,， 


2015-12-12", 1)"); 


query = "INSERT INTO todo ( id, title, DateDue,level ) VALUES (%s, 


todolist = ( 


( 12, 第 四 


个 ', datetime.date(2015, 11, 11) ,12 ), 


(13, "第 五 个 , datetime.date(2015, 11, 18) ,132 ) 


execute 也 支持 本 例 品 


H executemany 所 使 用 的 字符 
%s 形式 对 应 的 是 序列 数据 ， 见 下 例 。 如 使 用 〈%(namejs) 形式 则 对 应 的 是 字典 数据 。 


形式 ， 即 


cur.execute(""" INSERT INTO todo (id,title , DateDue ,level) 


VALUES (96s, 
个 ', datetime.date(2015, 11, 11) ,12) 


(12, 28 V 


exexcutemany 的 数据 为 序列 的 序列 〈%s 形式 格式 符 ) 或 字 


%s, Vos ,%s) ; """, 


%s, Vos , Vos)" 


(96s) 或 (%(name)s). 


4| 


LN 


典 序 列 (%(name) 形 式 格式 


添加 数据 之 后 ， 可 用 select 语句 进行 查询 。 通 常 有 两 种 查询 方式 : 一 种 是 使 用 


符 )。 
cursor.fetchall0 获 取 所 有 查询 结果 ， 然 后 再 一 行 
获取 一 条 记录 ， 直 到 获取 的 结果 为 空 。 下 例 通过 两 和 


性 与 fetchall0 可 构建 查询 结构 的 字 则 


rows = cur.fetchall() 


print "所 有 字段 名 ", zip(*cur.description)[0] 
columnname-zip(*cur.description)[0] 


for row in rows: 
k=0 


while k <len(columnname): 


print columnname[k], 


k=k+1 


# one by one 


"n.n 


:", TOW] 


[k] 


cur.execute("SELECT * FROM todo") 


while True: 
row = cur.fetchone() 
if row == None: 
break 


print row[0], row[1], row[2] 
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ITIER; 另 一 种 是 每 次 通过 cursor.fetchone() 
[方式 查询 数据 。 


一 个 列表 C(name,type code,display size,nternal size,precision,scale,null ok)。 通 过 description 属 


游标 的 description 返回 了 


EH 形式， 下 例 中 fetchall 以 键 值 方式 显示 了 查询 结果 。 
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* 
除了 游标 description 构建 查询 结果 字典 形式 ， 还 有 字典 形式 的 游标 可 直接 返回 游标 数 
据 。 例 如 : 


conn-psycopg2.connect(database-"test",  user-"postgres",  password-"postgres",  host-"127.0.0.1", 
port" 5432". connection factory-psycopg2.extras.DictConnection ) 

dict cur-conn.cursor( cursor factory-psycopg2.extras.NamedTupleCursor) 

dict cur.execute(" SELECT * FROM todo") 

rows = dict cur.fetchall() 

for row in rows: 

print row['id'],row['title'] 
conn.close() 


8.9 MySQL 


MySQL 的 Python 接口 有 MySQL 自 带 的 MySQL Connector/Python 与 MySQLdb . 
MySQL Connector/Python 兼容 Python DB-API 2.0， 完 全 使 用 Python 实现 ， 并 且 不 依赖 
Python 标准 库 以 外 的 第 三 方 库 。MySQL Conntector/Python 针对 不 同 操作 系统 提供 了 相应 的 
安装 软件 包 ，Windows 下 为 MSI 安装 包 。 所 有 的 Python 对 应 版 本 与 操作 系统 版 本 均 可 从 
http://dev.mysql.com/downloads/connector/python/ 下 载 。 

本 节 以 82 节 的 数据 为 例 说 明 如 何 创建 数据 库 、 表 ， 插 入 数据 并 查询 。 首 先是 创建 数据 
库 、 表 。cnx 是 创建 的 数据 连接 ， 可 通过 名 称 参数 形式 创建 ， 也 可 通过 字典 形式 创建 。 通 过 
连接 对 象 创建 的 游标 的 execute0 函 数 执行 SQL 语句 创建 数据 库 与 表 。 


cnx =mysql.connector.connect ( user='root', password='123456', 
host-'127.0.0.1") 


cursor = cnx.cursor() 
cursor.execute( 
"CREATE DATABASE (1 DEFAULT CHARACTER SET 'utf8"".format(DB NAME)) 
TABLE -(" 
CREATE TABLE 'todolist .todo ( 
"id. INT NOT NULL COMMENT", 
"titile TEXT NULL COMMENT", 
"posted on DATE NULL COMMENT", 
"datedue' DATE NULL COMMENT", 
"leve INT NULL COMMENT ", 
PRIMARY KEY (id) COMMENT ") 


m 


) 
cursor.execute(TABLE) 


cursor.close() 
enx.close() 
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创建 表 todolist 后 ， 通 过 insert 语句 插入 数据 。 


cnx = mysgql.connector.connect(user-' root', password-'123456', 
host-'127.0.0.1', 
database-DB NAME 
) 


cursor — cnx.cursor() 


insertsql = ("INSERT INTO todo " 
"(id, titile, posted on, datedue, level) " 
"VALUES (95s, Vos, Vos, Vos, Vos)") 


todo datal = (12, 'write','2012-09-08', '2012-09-09'.1 ) 
todo data2-(10,str(datetime.now().date()), str( datetime.now().date()-- timedelta(days-1)),2) 


cursor.execute(insertsql, todo datal) 


todo data2-(10," read" str(datetime.now().date()), str( datetime.now().date()*- timedelta(days-1)),2) 
cursor.execute(insertsql, todo data2) 

enx.commit() 

cursor.close() 

enx.close() 


通过 SQL 的 SELECT 语句 查询 刚刚 插入 的 数据 。 


cnx = mysql.connector.connect(user='root', password='123456', 
host='127.0.0.1', 
database=DB_NAME 


) 


cursor = cnx.cursor() 


query= "SELECT * FROM todo " 


cursor.execute(query ) 
while True: 
row = cursor.fetchone() 
if row == None: 
break 
print (row[0], row[1], row[2] ,row[3]) 


cnx.commit() 
cursor.close() 
cnx.close() 
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这 些 数据 库 接 口 
法 相同 。 


虽然 本 节 是 关于 MySQL Connector/Python 的 内 容 ， 但 操作 方式 与 8.2 节 几 乎 相同 ， 因 为 
均 遵 循 DB API 2.0. MySQL 的 另外 一 个 接口 是 MySQLdb， 与 本 节 的 使 用 方 
但 上 述 各 方法 均 需 熟悉 SQL 语句 。 下 一 节 提 供 了 无 需 熟 悉 SQL 语句 就 可 进行 数据 


库 访 问 的 方法 。 


84 高 级 话题 ORM 


结构 发 生变 化 ， 所 有 的 数据 存 取 过 程 都 需要 进行 相应 的 改变 。8.2 节 说 明了 在 查询 数据 库 


H 


接口 。 


用 传统 的 方式 访问 数据 库 ， 不 仅 要 求 熟悉 SQL， 而 且 需 要 了 解 表 的 数据 结构 ， 一 旦 数据 
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时 ， 会 直接 返回 字典 数据 ， 但 将 Python 数据 插入 到 数据 中 以 及 更 新 时 还 是 需要 写 大 量 代 
码 。 使 用 ORM 可 以 解决 这 类 问题 。ORM 是 对 数据 库 模 式 的 描述 ， 该 描述 对 应 了 应 用 程序 
的 对 象 ， 将 Python 对 象 映射 到 数据 库 行 ， 


ORM 具有 如 下 优点 : 


并 提供 了 一 些 用 于 从 数据 库 中 存 取 对 象 ( 行 ) 的 


e 简单 : ORM 以 最 基本 的 形式 建立 数据 模型 。ORM 将 数据 库 的 一 张 表 映 射 成 一 个 
Python 类 ， 表 的 字段 就 是 这 个 类 的 成 员 变量 。 

e 统一 : ORM 使 所 有 的 数据 表 都 按照 统一 的 标准 映射 成 Python 类 ， 使 系统 在 代码 层 
面 保持 准确 统一 ， 从 而 可 实现 转换 数据 库 时 ， 无 需 相应 的 SQL 语句 。 

€ JF: ORM 避免 了 不 规范 、 见 余 、 风 格 不 统一 的 SQL 语句 ， 可 以 避免 很 多 人 为 


Bug， 方 便 编码 风格 的 统一 和 后 期 


E 护 ， 更 适合 初学 者 使 用 。 


目前 优秀 的 Python ORM 软件 有 SQLAlchemy、SQLObjec 和 Django 的 ORM。 本 节 主 要 


fif SOLAlchemy. 


i 


SOLAlchemy 将 数据 看 作 关系 代数 引擎 ， 而 不 仅仅 是 表 


r 


的 集合 。 行 不 仅仅 看 作 来 自 表 ， 


也 是 连接 和 其 他 语句 。 所 有 其 他 的 单元 构成 大 的 结构 。 


据 库 的 SQL 语句 。 也 提 任 


7 


f 


username, password. host. port. database 分 别 是 数据 库 用 户 名 、 密 码 、 主 机 地 址 、 数 据 库 


SQLAlchemy 已 经 包含 在 Anaconda F, 
本 节 以 8.2 节 的 todo 表 为 例 说 明 SOLAlchemy 的 使 用 。 


无 需 单 独 安装 。 


create_engine0 返 回 引擎 的 实例 ， 代 表 数 据 库 核 心 接 口 ， 建 立 与 数据 库 DBAPI 连接 。 引 
擎 融合 了 数据 库 连 接 池 与 数据 库 特 定 的 dialect 层 ， 将 SQLAlchemy 的 SQL 表达 式 转换 成 数 


tT Engine.execute0 和 Engine.connectO 操 作 ， 但 在 ORM 条 件 下 ， 


民 少 直接 使 用 Engine 操作 数据 库 。 其 中 create engine 函数 的 参数 是 连接 不 同 数据 库 并 通过 
echo 参数 显示 所 有 SQL 的 生成 过 程 ,URL 的 格式 主要 是 : 


dialect+driver://username:password@host:port/database 


其 中 dialect 是 指 SQLAlchemy 用 于 表示 数据 名 ， 例 如 sqlite, mysql. postgresql ~ 
oracle, mssql 等 。driver 只 是 DBAPI 名 字 ， 如 使 用 psycopg2 则 driver 变 为 psycopg2. 


端口 、 数 据 库 名 。 下 面 是 一 些 连接 例子 。 


# 默认 postgresql 


engine = create engine('postgresg[://scott:tiger(a)localhost/mydatabase ’ ) 
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# 使 用 psycopg2 

engine = create engine(' postgresql-psycopg2://scott:tiger(a)localhost/mydatabase' ) 
# 默认 MySQL 

engine = create engine(^ mysq[://scott:tiger(a)localhost/foo ° ) 

engine = create engine('oracle://scott:tiger(a)127.0.0.1:1521/sidname" ) 

engine = create engine('oracle*cx oracle://scott:tiger(à)tnsname" ) 


engine = create engine('"sglite:///foo.db ° ) 
# 使 用 SQLite 的 内 存 数据 库 

engine = create engine('sglite://") 
如 果 没 有 ORM， 将 数据 库 表 中 一 个 行 数 据 读 入 到 应 用 程序 或 进行 反 向 操作 ， 均 需要 编 
写 相应 的 SQL 语句 。 而 通过 ORM 可 很 轻松 地 将 数据 库 中 的 表 与 应 用 程序 中 的 类 定义 对 应 起 
来 ， 并 将 SQL 语句 隐藏 起 来 ， 简 化 用 户 操作 数据 库 的 过 程 。 
SQLAlchemy 隐藏 数据 库 与 程序 类 的 方法 主要 是 使 用 mapper 方法 或 者 SQLAlchemy 扩 
Jë declarative. declarative 语法 允许 在 一 步 执行 中 创建 表 、 类 和 数据 库 上 映射。 下 例 声明 了 
Todo 类 ， 通 过 这 种 声明 方式 ，SQLAlchemy 能 够 在 一 步 中 创建 一 个 数据 库 表 、 创 建 一 个 类 以 
及 类 与 表 之 间 的 映射 。Base=declarative base0 行 创建 了 一 个 类 ，Todo 继承 自 该 类 。 这 个 
DeclarativeMeta 类 型 的 优势 就 是 允许 所 有 操作 发 生 在 一 个 简单 的 类 定义 中 。 


Base = declarative base() 
class Todo(Base): 
. tablename  — "todo" 
id = Column(Integer, primary key-True) 
title = Column(String(255), nullable—False) 
posted on = Column(DateTime,default-datetime.datetime.now() ) 
status = Column(Boolean, default-False) 
datedue-Column(DateTime ) 
level- Column(Integer ) 
def init (self; id, title,level,datedue): 
iit iom 
self.id = id 
self.title = title 
self.level-level 
self.datedue-datedue 
def repr (self): 
return "<todo ('%s', Vos "os", "Vos , os )-^" % (self.id, selftitleselflevel,self.datedue,self.posted on) 


另 一 个 需要 指出 的 地 方 是 本 示例 并 未 实际 执行 任何 操作 。 在 运行 创建 表 的 代码 之 前 ， 将 
不 会 创建 实际 的 表 。 执 行 下 面 的 create all 语句 之 后 ， 才 真正 创建 表 。 


Base.metadata.create all(engine) 


SQLAlchemy 的 “官方 ”文档 将 Session (CAW) 描述 为 数据 库 的 句柄 ， 用 于 建立 所 有 与 
数据 库 的 会 话 以 及 加 载 对 象 的 存储 ， 提 供 获 取 碍 询 对 象 的 入 口 点 。 查 询 对 象 使 用 会 话 对 象 的 
当前 数据 库 连 接 发 送 数 据 库 查询 ， 并 将 查询 接口 填 入 _ Session 中 的 对 象 中 。 它 允许 不 同 的 基 
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于 事务 的 连接 发 生 在 SQLAlchemy 一 直 在 等 待 的 连接 池 中 。 在 会 话 内 部 ， 通 常 是 添加 数据 


到 数据 库 中 、 执 行 查询 或 删除 数据 。 会 话 建立 所 有 与 数据 库 的 会 话 以 及 加 载 对 象 的 
holdingzone， 提 供 了 获取 查询 对 和 象 的 入 口 。 会 话 在 提交 或 者 回 深 前 ， 代 表 正 在 进行 的 事务 。 
会 话 可 通过 execute 函数 执行 SQL 语句 。 


Sç 
= 


话 的 创建 是 通过 sessionmaker 的 会 话 工 厂 函 数 创建 的 ， 可 在 创建 时 绑 定 数据 库 引 擎 或 


在 创建 后 通过 configure0 函 数 进行 配置 ; 


使 用 add0 添 加 实例 到 session。 在 执行 commit0 之 前 ， 数 据 库 中 并 未 实际 产生 数据 ， 但 通过 
据 


session=sessionmaker(bind=engine) 


query0 是 可 以 查看 到 数据 的 。 例 如 下 例 中 todol. todo2. todo3 是 通过 add(). add all0 添 加 到 数 


库 中 的 ， 


在 执行 commit0 之 前 ， 可 碍 看 数据 库 内 容 核实 todol. todo2. todo3 并 没有 添加 到 数据 


库 中 ， 只 是 在 执行 commitO 语 名 之 后 才 添 加 到 数据 库 中 。add0 或 add_all0 称 为 实例 挂 起 ， 并 
无 实际 的 SQL 语句 执行 ， 即 对 象 并 无 对 应 数据 库 行 。 通 过 flush 线程 ,会 话 可 将 todol 存 到 数 


据 中 ， 在 执行 queryO 时 ,首先 执行 从 挂 起 数据 中 查询 ， 所 以 会 查 到 相应 数据 。 
通过 session.commit() 或 者 session.flush() HJ f. Python 实例 存储 到 数据 库 


Session = sessionmaker(bind=engine) 
session = Session() 
todol = Todo(id=1,title="test1",level=12,datedue=datetime.datetime.now!()) 
todo2 = Todo(id=2,title="test2" level=12,datedue=datetime.datetime.now()) 
todo3 = Todo(id=3,title="test3",level=12,datedue=datetime.datetime.now!()) 
try: 

session.add(todol) 

session.add all([todo2,todo3]) 


session.commit() 


todol. todo2. todo3 的 数据 内 容 在 执行 commit() 或 者 flush0 之 前 还 都 不 在 数据 库 中 ， 
那么 下 面 的 删除 与 更 新 就 比较 好 理解 了 。 完 全 按照 Python 风格 修改 实例 的 属性 以 及 删除 实 


例 ， 在 需要 保存 到 数据 库 时 ， 执 行 session.commit() 或 者 session.flush(). 


session.delete(todol) 


session.commit() 


#update 
todo2.title="test!" 


session.commit() 


commit(), flush()*J JV rollback() FK 2, rollback() PRR. FER: 


e 所 有 事务 被 撤销 并 且 所 有 连接 回 到 连接 池 ， 除 非 会 话 被 直接 绑 定 到 连接 上 ， 这 时 连 


接 被 重 置 ( 但 仍旧 被 回 深 )。 


e 添加 到 会 话 中 挂 起 的 对 象 被 删除 ， 相 应 的 INSERT 语句 被 回 滚 。 属 性 保持 不 变 。 


e 标记 删除 的 对 象 恢复 到 连接 状态 ， 对 应 的 DELETE 语句 被 回 滚 ，SQLAlchemy 提供 


了 query 对 象 ， 用 于 取 回 表 中 的 记录 。 最 基本 的 操作 是 session.query(Todo).all0， 返 回 
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表 中 的 所 有 记录 。 例 如 : 


alldata-session.query(Todo) .all() 
for data in alldata: 
print data 


通过 session.query(Todo) .all0 返 回 一 个 列表 ， 列 表 的 数据 为 Todo 对 象 ， 可 直接 访问 对 
象 属性 ， 例 如 _dataid。 返 回 所 有 对 象 的 查询 实际 意义 不 是 很 大 。query 对 象 提供 了 修改 查询 
对 象 的 方法 ， 最 常用 的 是 filter() 与 flter_by0, 即 实现 过 滤 功 能 。 例 如 ; 


alldata-session.query(Todo) .filter(Todo.level>10 ).all() 


filter 在 query 对 象 上 执行 ， 返 回 的 是 一 个 query 对 象 ， 所 以 可 继续 调用 all0 方 法 。 除 了 
filter( 与 filter byO 过 滤器 ， 还 有 几 个 常用 的 过 滤器 : limitO 限 制 返 回 值 的 结果 数量 ， 返 回 一 
个 新 的 查询 ，offset0 偏 移 查 询 返 回 结果 ， 生 成 新 查询 ; order by0O 对 碍 询 结果 进行 排序 ， 返 回 
新 的 查询 ; group_by0 根 据 指定 条 件 对 查询 结果 分 组 ， 返 回 新 查询 。 

对 于 过 滤 所 生成 的 SQL 语句 ， 可 通过 str(session.query(Todo).filter(Todo.level>10)) 显 示 相 
应 的 SQL 语句 。 
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章 是 关于 Python 中 使 用 关系 型 数据 库 的 介绍 。 除 了 本 章 介 绍 的 Sglite. PostgreSQL. 
MySQL 数据 库 外 ， 常 用 的 数据 库 还 有 Oracle, MS SQL Server 等 ， 数 据 库 的 选用 取决 于 操 
作 系 统 、 资 金 、 性 能 要 求 等 情况 。Postgresql 的 前 身 POSTGRES 由 数据 库 专家 Michael 
Stonebraker (2014 年 图 灵 奖 得 主 ) 开发 ， 其 数据 接口 比较 多 ， 但 基本 操作 方法 相同 。 
MySQL 是 流行 的 数据 库 ， 本 章 选用 MySQL 官方 提供 的 接口 程序 MySQL Connector/Python 
(http://dev.mysql.com/doc/connector-python/en/index.html) 讲解 了 对 MySQL 数据 库 的 访问 。 

ORM 简化 了 SQL 层 与 Python 对 象 的 关联 过 程 ， 使 得 开发 人 员 将 精力 集中 在 Python 对 
象 层 ， 而 无 需 编 写 SQL WA, A ORM 也 提供 直接 执行 SQL 语句 的 方法 。ORM 除了 文中 
介绍 的 SQLAlchemy， 常 用 的 还 有 SQLObject。 
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互联 网 在 不 断 发 展 ， 
们 的 生活 方式 。Python 也 以 各 种 形式 参与 到 

Python 对 网 络 有 较 好 的 文 持 ， 各 种 通信 
SNMP 均 有 对 应 的 Python 包 。 但 通信 协议 对 
活 ， 如 网 络 购物 均 从 Web 的 URL 
览 器 应 用 ， 还 有 各 种 爬虫 获取 网 络 信息 构建 大 数据 。 
urllib/urllib2, 3# scrapy、Beautiful Soup 等 
量 的 Web 应 月 
但 它 具 


网 络 编 程 


已 经 以 各 种 形式 渗透 到 各 行 各 业 中 ， 形 成 了 互联 网 +， 


互联 网 + 中 。 
协议 如 TCP. UDP. 


telnet、 


开始 。Web 分 为 客户 端 和 服务 器 端 。 客 户 


并 改变 了 人 


FTP. SMTP, 
普通 人 而 言 过 于 高 深 。Web 则 更 贴近 人 们 的 生 
端 除了 常见 的 浏 


HE 


有 极 强 的 扩展 性 。 


而 后 过 渡 到 CGI 编程 ， 最 后 讲 


9.1 


TCP/IP i&H]-T JP 


网 络 基础 


只 服务 器 通信 ， 在 该 模式 下 ， 服 务 器 一 直 侦 听 来 


i 


在 有 


请 求 后 建立 连接 处 理 请 


例 


< 


Python 提供 
Socket 实现 Http Server， 返 回 
作 均 在 main FK fc H 
TCP/IP 的 套 接 字 ， 
议 分 析 由 程序 自己 完成 。bindO 函 数 
] accept() 等 待 连接 ， 默 


行 TC 


解 Flask。 


Python 的 客户 端 除了 自 
优秀 包 可 用 于 从 网 络 中 获取 数据 。 服 务 器 端 有 
框架 如 Django. webpy. Twisted Web, Zope, Flask 等 。Flask 属于 小 型 框架 


本 章 首 先 从 基础 的 套 接 字 编 程 实现 一 个 简单 的 Http 服务 器 开 


rB 


大 


始 ， 


求 。 


已 面 ，socketO 函 数 
socket.IPPROTO IP 表示 可 


听 。 服 务 器 调 


P 监 


程序 在 连接 到 来 之 


客户 端 
函数 。 


于 后 


通 


连接 


import socket 
import os 
import sys 
import datetime 


def resolve uri(url): 


前 处 于 挂 起 状态 ， 
sendall() 与 recv0) 是 发 送 接收 函数 。 表 9-1 是 常用 的 套 接 字 


T 
Ho 


Z 


的 全 部 方法 ， 


客户 端 对 其 的 访问 时 间 与 IP。 有 


地 址 和 端口 


于 将 主机 号 绑 定 套 接 字 。 


客户 


下 例 (ch9- 
关 套 接 字 (socket) 的 操 
创建 套 接 字 ， 其 中 socket.SOCK STREAM 表示 


端的 请 求 ， 


如 在 浏览 器 地 址 栏 中 输入 www.python.org， 浏 览 器 将 链接 www.python.org 的 服务 器 ， 
并 请 求 访问 “/” 页 面 ， 服 务 器 接 到 该 请 求 后 ， 将 该 页 面 返回 客户 端 。 
了 访问 底层 操作 系统 Socket PZ 


1.py) 是 以 


N 


创建 


于 接收 任何 IP 数据 包 ， 其 中 的 校 验 与 协 
listen) ZRH 


认 情 况 下 ，accept0 函 数 是 阻 


塞 式 的 ， 即 


一 且 收 到 一 个 连接 ，acceptO 函 数 会 返回 


个 上 


单独 的 


Python Fp 4 Pp Jf] 


TYPE = "text/html\n\n" 

BODY = "<!DOCTYPE HTML><html><head><title>Directory</title></head>\n" 
BODY+="<h1> Hello World " +str( datetime.datetime.now() )*"«/h1»" 
BODY+="<h2> url= "+url+"</h2>" 

BODY += "</body></html>" 

return TYPE, BODY 


def parse request(request): 
try: 
request = request.split(" vn Ww Wn", 1) 
req = request[0].split(" ^n") 
for i, rin enumerate(req): 
req[i] = r.split() 
method = req[0][0].upper() 
url = req[0][1] 
print "url" url 
proto — req[0][2].upper() 
headers = () 
for line in req[1:]: 
headers[line[0].upper()] = line[1:] 
if method == "GET": 
if proto == "HTTP/1.1" and "HOST:" in headers: 
return url 
else: 
raise SyntaxError("400 Bad Request") 
else: 
raise ValueError("405 Method Not Allowed") 
except IndexError: 
raise SyntaxError("400 Bad Request") 


defresponse ok(TYPE, BODY): 


return ("HTTP/1.1 200 OK n" 
"Content-Type: " + TYPE + "nn" 
"rnn" + BODY) 


def main(): 
ADDR - ("127.0.0.1", 8000) 
server — socket.socket( 
socket.AF INET, socket.SOCK. STREAM, socket.IPPROTO IP 


) 
server.setsockopt(socket.SOL SOCKET, socket.SO REUSEADDR, 1) 
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server.bind(ADDR) 
server.listen(1) 


while True: 


==" main 


conn, addr = server.accept() 
s, msg = "", True 
while msg: 
msg — conn.recv(1024) 
s += msg 
if len(msg) < 1024: 
break 
print s 
try: 
url = parse request(s) 
TYPE, BODY - resolve uri(url) 
resp = response ok(TYPE, BODY) 
except (SyntaxError, ValueError, UserWarning) as e: 


resp — response error(e) 


except KeyboardInterrupt as e: 


break 


except Exception as e: 


print e 


print (resp) 


conn.sendall(resp) 
conn.close() 


" ". 


if name 
main() 
运行 该 程 


序 后 ， 在 浏览 器 中 输入 127.0.0.1:8000， 会 显示 如 


图 9-1 所 示 内 容 。 


@ http://127.0.0.1:8000 p-ó | B Http Server 


Hello World 2015-08-03 20:44:08. 104000 


ur1-127. 0. 0. 1:8000/ 


图 9-1 Http 服务 器 


该 程序 不 仅 实现 了 http 服务 器 ， 也 实现 了 CGI 程序 。 但 


互联 网 的 模型 。 


下 一 节 将 介绍 CGI 程序 。 


w 


类 该 程 


4 


序 的 设计 模式 不 适合 
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表 9-1 常用 套 接 字 


BS 描述 
提取 出 所 监听 套 接 字 的 等 待 连接 队列 中 第 一 个 连接 请 求 ， 
GS 创建 一 个 新 的 套 接 字 ， 并 返回 指向 该 套 接 字 的 文件 描述 符 
socket.bind() 绑 定 socketconnectO 
socket.listen() 监听 套 接 字 的 连接 
socket.connect() 连接 远程 套 接 字 
socket.recv() 读 取 套 接 字 中 数据 
socket.send() 通过 套 接 字 发 送 数据 
socket.getpeername() 连接 到 当前 套 接 字 的 远 端 地 址 
socket.getsockname() 当前 套 接 字 的 地 址 
socket.setsockopt() 设置 指定 套 接 字 的 参数 
socket.close() 关闭 套 接 字 


02 (GI 


将 9.1 节 的 有 关 网 络 部 分 main 与 parse request 单独 作为 一 个 程序 ， 即 是 CGI 服务 器 。 
可 以 参考 Python 安装 目录 下 的 SimpleHTTPServer.py 文件 (Python 3 为 Lib\http\serverpy )， 
该 文件 是 一 个 HITPServer 服务 器 ， 创 建 并 监听 HTTP 套 接 字 ， 分 发 请 求 给 句柄 。 
CGIHTTPRequestHandler 用 于 CGI 脚本 。 

CGI《〈 公 共 网 关 接 口 ) 主要 运行 在 服务 器 上 ， 如 HTTP 服务 器 ， 提 供 同 客户 端 HTML 页 
面 的 接口 。 该 接口 用 于 Web 服务 器 处 理 来 自 浏 览 器 的 请 求 ，9.1 节 中 resolve uri() 与 
response_ok() 函 数 完成 了 该 功能 。 


9.2.1 CGI 模 块 

Python 中 提供 了 CGI 模块 ， 下 面 演 示 使 用 CGI 模块 实现 一 个 输入 用 户 名 和 密码 ， 然 后 
器 显 的 CGI 程序 。 首 先 建立 一 个 cgi-bin 目录 ， 在 该 目录 下 创建 一 个 cgitest.py 文件 ， 包 含 内 
容 如 下 。 


# encoding:utf-8 
# Vusr/bin/python 
import cgi 
# 显示 为 Html 
print "Content-Type: text/html\n\n" 
def generate form(): 
print "<HTML><HEAD><TITLE>Login</TITLE></HEAD><BODY >n" 
print ("<H3>input username and password </H3> n") 
print "<FORM METHOD = post ACTION = \"cgitest.py\">\n" 
print " Username: <INPUT type = text name = V'name V7 n" 
print " Password: <INPUT type = text name = VpwdV'7 n" 
print "<INPUT TYPE = hidden NAME = "action" VALUE = V'display V7 Wn" 
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print "<INPUT TYPE = submit VALUE = \"Enter">\n" 
print " <FORM>\n" 
print "</BODY>\n" 
print " <HTML>\n" 


def display_log(name, pwd): 


if name ==" main 


print " -HTML»«HEAD?^-TITLE-User Info Form</TITLE></HEAD><BODY> n" 
print "username:", name, "nn password :", pwd 

print "</BODY>\n" 

print "</HTML>\n" 


==" ". 


form = cgi.FieldStorage() 
if (form.has key("action") and form.has key("name") and form.has key("pwd")): 
if (form["action"].value == "display"): 
display log(form["name"].value, form["pwd"].value) 
else: 
generate form() 


首先 通过 print "Content-Type: text/html\n\n" P Æ HTTP 3k. (对 比 9.1 节 中 response ok FÉ 
7D, CGI 程序 要 求 至 少 生成 一 个 Content-Type header， 用 于 通知 浏览 器 收 到 什么 类 型 的 文 


从 Web 客户 


据 。 从 上 面 的 代码 可 看 出 ，CGI 程序 需要 程序 员 编 写 大 量 代码 进行 HTML 的 解释 。 


件 。 而 且 在 生成 HTTP 头 后 ， 需 要 发 送 一 个 空 行 ， 用 于 区 分 头 与 文档 。 FieldStorage 实例 可 


端 读 取 有 关 的 用 户 信息 ， 包 含 类 似 字典 的 对 象 ， 可 通过 键 值 方式 访问 其 中 数 


Python H 


选用 Apache. 


nginx 等 优秀 的 Http 服务 器 。 在 cgi-bin 的 上 一 级 目录 运行 : 


python -m CGIHTTPServer 8888 


在 浏览 器 地 


址 栏 输入 http://ocalhost:8888/cgi-bin/cgitest.py， 即 可 看 到 如 图 


O )| @ http://127.0.0.1:8888/cgi-bin/cgitest.py pro | & Login | 


Username: 


input username and password 


Password: | Enter 


注意 : CGIHTTPServer 默认 的 端 
处 选用 8888 端口 。 


9.2.2 WSG 


图 9-2 CGI 示例 


I 


带 了 一 个 Web 服务 器 CGIHTTPServer， 可 用 于 学 习 和 代码 测试 ， 生 产 环境 可 


9-2 所 示 结 果 。 


号 是 8000, 但 可 能 存在 该 端口 号 被 占用 的 情况 ， 故 此 


目前 直接 基于 CGI 的 应 用 很 少 。Python 定义 了 一 个 WSGI (Python Web 服务 器 网 关 接 
口 )，WSGI 提供 了 Web 服务 器 和 Web 应 用 程序 之 间 的 简单 通用 接口 ， 从 而 使 程序 员 不 必 关 


心 Web 服务 器 的 编写 方式 ， 无 论 是 采 上 


H Python 语言 编写 (例如 Medusa), [SEK Python 〈 例 
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如 mod pyton) 还 是 通过 网 关 协 议 激活 Python 的 方式 〈 例 如 CGI FastCGI 等 )， 使 得 Web 
开发 框架 都 与 Web 服务 器 无 关 。 另 外 ， 本 节 讲 解 的 CGI 例 程 离 不 开 所 用 的 CGI 模块 以 及 对 
应 的 HttpServer， 而 WSGI 可 避免 这 种 一 对 一 关系 《应 用 程序 可 运行 在 多 种 遵从 WSGI 的 服 
务 器 上 )， 而 且 WSGI 比 CGI 简单 ， 并 具有 扩展 性 〈 有 大 量 的 WSGI 服务 器 、 第 三 方 组 
件 )。 WSGI 接口 有 服务 器 〈 或 者 说 网 关 ) 端 和 应 用 程序 〈 或 者 说 框架 ) 端 。 
WSGI 服务 器 端 提供 了 一 个 environ 字典 和 一 个 start response AZt. environ 字典 需要 提 
供 一 些 WSGI 定义 ,例如 wsgi.version 表示 该 请 求 遵守 WSGI 版 本 信息 ，tuple 类 型 。 
wsgi.url scheme 表示 HTTP 请 求 的 协议 为 https 或 htp 。wsgiinput 表示 一 个 输入 流 ， 类 似 于 
file 对 象 ， 用 于 读 取 用 户 传 输 的 信息 。start response 是 一 个 可 调用 对 象 ， 由 Web server 以 参 
数 的 形式 传 给 应 用 程序 。 应 用 程序 调用 start response， 用 以 返回 HTTP 响应 的 状态 和 头 。 目 
前 多 数 Http 服务 器 (Apache, nginx) 都 支持 WSGI 的 具体 实现 。 

https://wiki.python.org/moin/WSGIImplementations 给 出 了 遵守 WSGI 协议 的 Web 服务 器 
端 实现 以 及 客户 端 实 现 。 

下 一 节 中 的 Flask 是 众多 基于 WSGI 标准 客户 端 应 用 程序 中 的 一 亚 小 型 、 可 扩展 Web 
应 用 框架 。 


03 ”高 级 话题 ，Flask 


本 节 以 一 个 待 办 提醒 程序 为 例 说 明 Flask 的 用 法 。 本 节 中 的 源 代码 文件 在 app 目录 下 。 
源 代码 文件 为 todolist.py。 

static. 目录 用 来 存放 静态 文件 ， 例 如 图 片 、CSS EXX JavaScript 文件 。 该 目录 是 
Flask 的 静态 文件 默认 搜索 目录 。 

templates 目录 下 是 模板 文件 ，Flask 默认 在 该 目录 下 寻找 模板 文件 。 


9.3.1 Flask 简介 
Python 的 Web 框架 ， 主 要 有 Django. Tornado. web.py. Bottle, Flask 等 。 其 中 Flask 


属于 小 型 框架 ， 但 可 扩展 。 所 有 的 扩展 都 位 于 名 为 flask_ something 的 包 中 ， 其 中 
“something” 是 你 想 要 连接 的 库 的 名 字 。 例 如 当 计 划 为 Flask 添加 一 个 叫做 simplexml 的 库 
I 支持 时 ， 将 需要 扩展 的 包 命 名 为 flask_simplexml。Flask 通过 扩展 方式 提供 了 数据 库 操 
作 、 表 单 以 及 登录 系统 等 常用 的 应 用 。 例 如 : SQLAlchemy 是 优秀 的 ORM， 支 持 多 种 数据 
库 平 台 ; Flask-SQLAlchemy 为 对 应 的 Flask 扩展 ， 包 含 了 SQLAlchemy 框架 。 

Flask 依赖 Werkzeug 和 Jinja2 两 个 库 。 其 中 Werkzeug 提供 路 由 网 关 接 口 ， 遵 守 WSGI 
协议 ， 目 前 支持 Python 2.6/2.7 与 Python 3.3 以 上 版 本 ， 支 持 Unicode。 

Flask 的 实例 通过 如 下 代码 实现 : 


from flask import Flask 
app-Flask( name ) 


Flask 类 的 构造 函数 只 有 一 个 必须 指定 的 参数 ， 即 程序 主 模块 或 包 的 名 字 。Flask 通过 该 
参数 决定 程序 的 根 目录 ， 以 便 据 此 查找 资源 文件 位 置 ( 例 如 模板 文件 、 静 态 文件 )。 在 Flask 
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典 相同 ， 


第 
中 ， 通 过 Flask 实例 的 config 属性 进行 配置 。config 属性 是 字典 类 型 的 子 类 ， 使 用 方法 与 字 


例如 下 面 的 代码 使 应 用 程序 处 于 调试 模式 : 


app-Flask( name ) 
app.config['DEBUG']- True 


第 9 章 ”网 络 编程 


本 节 通 过 一 个 待 办 提醒 程序 讲解 Flask 的 使 用 。 其 中 待 办 数据 库 Godo R) 在 第 8 章 中 


已 经 使 用 过 。 下 面 针对 该 程序 进行 讲解 。 


Flask 路 由 是 指 URL 《网 页 地 址 ) 与 函数 之 间 的 关系 ，Flask 程序 使 用 app.route 装饰 器 


定义 路 由 ， 把 闭 饰 函数 注册 为 路 由 。 例 如 下 面 的 函数 index 通过 装饰 器 注册 为 根 地 址 。 其 ， 


methods 


参数 为 GET 和 POST。 如 果 没 有 指定 methods 参数 ， 就 只 


是 把 视图 函数 注册 为 GET 


请 求 的 处 理 程序 。render template 是 对 模板 引擎 Jinja2 的 render 封装 。 第 一 个 参数 是 模板 文 


为 Flask 


代表 index.html 中 的 占 位 符 ，todoform 与 等 号 右边 的 todo 代表 赋值 


下 面 的 delitem 视图 函数 ， 用 于 删除 特定 被 选项 ， 即 将 id 作为 参数 传递 给 delitem 视图 


件 ， 后 续 参 数 为 键 值 对 表示 模板 变量 中 的 真实 值 。 其 中 index.html 位 于 templates 目录 下 ， 因 


H form 与 等 号 左边 的 todo 


默认 模板 文件 在 templates 目录 下 。render templater 函数 


(Qapp.route("/" methods-['GET','POST']) 
def index(): 


return render template('index.html',form-todoform,todo-todo ) 


函数 。 其 中 <int:id> 表 示 匹 配 动态 id 为 整数 的 URL。Flask >Ë float. int, path 类 型 。 


@app.route('/del/<int:id>') 
def delitem(id): 
todo = Todo.query.filter by(1d-id).first() 
if todo: 
db.session.delete(todo) 
db.session.commit() 
flash(u" 记 录 删 除 成 功 ") 


return redirect(url for("index")) 


9.3.2 Flask-SQLAlchemy 


SQLAlchemy 在 第 8 348 Y i 
用 方法 基本 与 SQLAlchemy 相同 。Flask 下 的 SQLAlchemy Ë 


from flask.ext.sqlalchemy import SQLAlchemy 


Hif, Flask-SQLAlchemy 是 SQLAlchemy 的 Flask 扩展 ， 使 
ENH 


旦 如 下 : 


app.config'SOLALCHEMY DATABASE URI']= 'sglite:///c:/todo.sqlite' 


db = SOLAlchemy(app) 


1E 


6 8 章 已 经 讲解 了 Todo 数据 模型 ， 下 面 是 该 模型 在 Flask-SQLAlchemy 中 的 用 法 : 
class Todo(db.Model): 
"数据 模型 " 
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. tablename -'todo 
id — db.Column(db.Integer, primary key-True) 
title = db.Column(db.String(255), nullable-False) 
posted on = db.Column(db.Date, default-datetime.utcnow) 
status — db.Column(db.Boolean(), default-False) 
DateDue-db.Column(db.Date, default-datetime.utcnow) 
def init (self, *args, **kwargs): 

super(Todo, self). init (*args, **kwargs) 
def repr (self): 

return "«Todo '%s' :'%s':'%os':'%os':'%os'>" %( selftitle,self.status,self.DateDue,self.posted on,self.id) 
def validate title(form, field): 

if field.data == 0: 

raise ValidationError, U 内 容 不 能 为 空 ' 
Flask-SQLAlchemy 中 的 数据 库 操 作 与 SQLAlchemy 操作 类 似 ， 下 面 是 删除 记录 的 


def delitem(id): 
todo = Todo.query.filter by(1d-id).first() 
if todo: 
db.session.delete(todo) 
db.session.commit() 
flash(u" 记 录 删 除 成 功 ") 


return redirect(url for("index")) 


程序 使 用 了 Flask-Script， 因 此 Flask 支持 命令 行 的 Flask 扩展 ，( 后 续 内 容 对 此 扩展 有 更 
详细 讲解 )。 数 据 库 是 通过 db.create all0 创 建 的 。 用 法 如 下 : 


python todolist.py shell 
>>from todolist import db 
—»db.create all() 


表单 是 Web 应 用 程序 的 重要 组 成 部 分 ， 用 户 登 录 / 提 交 数 据 均 需 要 表单 。 同 时 表单 的 验 
证 是 保证 数据 安全 的 重要 手段 。 客 户 端的 验证 是 通过 JavaScript 和 HTMLS 实现 的 。WTForm 
提供 了 服务 器 验证 的 表单 工具 。 本 书 使 用 了 Flask-WTF， 即 WTForm 的 Flask 扩展 。 下 面 讲 
解 通 过 表单 实现 添加 新 待 办 事项 的 方法 。 


9.3.3 Flask-WTF 


Flask-WTF 表单 能 保护 所 有 表单 免 受 跨 站 请 求 伪 造 的 攻击 。Flask-WTF 需要 程序 设置 一 
个 密 钥 ， 通 过 该 密 钥 生成 加 密令 牌 ， 再 用 令 牌 验证 请 求 中 的 表单 数据 的 真 伪 ， 即 
app.config['SECRET KEY']. 
使 用 Flask-WTF 时 ， 每 个 Web 表单 都 由 一 个 继承 自 Form 的 类 表示 。 这 个 类 定义 表单 中 
的 一 组 字段 ， 每 个 字段 都 用 对 象 表示 。 字 段 对 象 可 带 有 一 个 或 多 个 验证 函数 。 验 证 函数 用 来 
验证 用 户 提交 的 输入 值 是 否 符合 要 求 。 下 面 是 添加 待 办 事项 的 表单 。 


class TodoForm(Form): 
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"表单 " 

title = StringField(u" 内 容 ",validators=[DataRequiredO]) 
DateDue-DateField() 

validate on submit = SubmitField('Submit") 


StringField 表示 文本 字段 ， DateField 表示 文本 字段 ， 但 值 为 datetime.date 格式 ; 
SubmitField 为 表单 提交 按钮 。StringField 中 validators 参数 指定 验证 函数 组 成 的 列表 ， 在 
接受 用 户 提 交 数 据 之 前 验证 数据 。 除 了 上 述 三 个 字段 ， 还 有 密码 文本 字段 、 单 选 杠 、 下 
拉 列 表 等 字段 。 验 证 函数 除了 DataRequired， 还 支持 正则 表达 式 。 

表单 的 演 染 可 采用 9.2 节 的 方式 ， 但 Flask-Bootstrap 提供 了 更 简单 的 方式 ， 其 位 于 


Index.html 中 : 


n 


(9 oimport "bootstrap/wtf.html" as wtf 96) 
{{wtf.quick form(form)}} 


Bootstrap 是 Twitter 提供 的 开源 框架 ， 用 于 开发 用 户 界面 ， 可 创建 整洁 优秀 的 网 页 ， 并 


CAE BU, Web 浏览 器 。Bootstrap 不 涉及 服务 端 。 为 了 在 Flask 中 使 用 Bootstrap， 需 要 使 
| Flask-Bootstrap 扩展 。 用 法 如 下 ; 


"m y 


from flask.ext.bootstrap import Bootstrap 


bootstrap — Bootstrap(app) 


9.14 Jinja2 


Jinja2 模板 类 似 字 符 串 的 format、template。 模 板 中 包含 变量 或 者 表达 式 ， 泻 染 时 加 以 替 
换 。 例 如 如 下 字符 串 格 式 化 代码 : 
template = "hello {name} , your message is (message) ".format(name-"apache",message-"tomcat") 


print(template) 


Jinja2 的 代码 与 上 述 代码 类 似 ， 通 过 替换 占 位 符 生成 相应 的 字符 串 。 例 如 : 


import jinja2 as jj 
template = jj. Template('Hello ( (where) 1") 
template.render(where = "World") 
Jinja2 M {{name £i J e N p AE ig, YECRRDXETI BR, Apul ELS] i (wherel) o 
Jinja2 可 识别 所 有 Python 类 型 的 变量 ， 例 如 列表 、 字 典 和 对 象 ， 并 可 使 用 过 滤器 修改 变量 ， 
过 滤器 添加 变量 名 之 后 ， 中 间 用 竖 线 分 隔 。 例 如 : 


template = jj. Template('Hello í {name[2]}}") 
template.render(name = [12,23,34]) 

template = jj. Template('Hello í (name|lower] 1") 
template.render(name = "WORLD") 
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Jinja2 还 提供 了 多 种 探 


代码 为 ch9-2.py， 为 独立 于 本 节 其 余 内 容 的 程序 )。 


AN 


e {%... % HT fit 
e ((.. 分 用 于 表示 变量 。 


rH; 


"mum 


htmltext =u 
<!DOCTYPE html> 
<head> 
<title> 网 页 </title> 
</head> 
<body> 
«ul» 
(96 for item in items%} 
<li><a href-" ( ( item.href } )"7 ( ( item.caption }}</a></li> 
{% endfor 96) 
</ul> 
<h1> 网 页 内 容 </h1> 
{{ var|capitalize }} 
Gb 注释 A 
</body> 


</html>""" 


import jinja2 as jj 
template =JJ.Template(htmltext) 
class 1: 

pass 
items =list() 
items.append(i() ) 
items.append(i()) 
items[0].hre£- www.sina.com' 
items[0].caption-"'sina' 
items[1].href£-'www.yahoo.com' 
items[1].caption-'yahoo' 
print template.render(var-u" hello", items-items) 


c 


e (H... ARER. 
Flask 的 模板 文件 ， 默 认 配置 在 本 节 例 程 templates 目录 下 ， 


模板 文件 ， 


i 
T 


<body class="page"> 
{% block content 9o) {% endblock 96) 
<br /> 


在 index.html 中 对 content 进行 修改 。 下 面 是 index.html H 
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症结 构 、 宏 、 模 板 继承 、 块 标签 。 下 面 是 Jinja2 模板 的 用 法 ( 源 


本 节 的 待 办 事项 程序 有 三 个 


分 别 是 base.htmlindex.htmlpage 404.html。 其 中 base.html 为 基 模 板 ，index.html 
通过 {% extends "base.html" %} 集 成 了 base.html 模板 。base.html 中 定义 了 块 : 


FXJ content 内 容 进行 修改 的 


第 9 章 网络 编程 


方法 。 


(9o block content 96] 
«h2- 
«div align="center "> 待 办 事项 </div></h2> 


{% endblock %} 


Flask 的 静态 文件 (例如 图 片 、CSS 文件 、Javascript 文件 ) 默认 在 static 目录 下 ， 可 直 
接 显示 /调用 。 下 面 是 base.html 文件 中 显示 图 片 的 方式 。 第 一 行 与 普通 html 语句 的 显示 网 像 
方式 相同 。 第 二 行 是 使 用 Jinaja2 模板 ， 即 使 用 url. for KZE URL. 


«img src="static/logo-full.png"> 
«img src="{{url for('static', filename-jinja-smallpng))])" > 


9..5 用 Matplotlib 与 Flask 显示 动态 图 片 


在 第 1 章 中 介绍 了 Matplotlib. Matplotlib 也 可 嵌入 到 Web 中 。 
首先 介绍 一 下 Matplotlib 的 绘制 原理 。Matplotlib 为 两 层 结构 : 

e 滨 染 器 (renderer): 用 于 绘制 图 形 。 

© 画布 (canvas): 图 形 绘制 的 地 方 ， 代 表 了 真正 进行 绘图 的 后 端 (backend). 

标准 的 泻 染 器 是 AGG 库 ， 可 生成 反 走样 以 及 亚 像素 精度 的 出 版 物 级 质量 的 图 像 。GUI 
对 应 不 同 的 泻 染 器 ， 例 如 Qt 对 应 的 泻 染 器 是 QtAgg，GTK+ 对 应 的 是 GtkAgg 泻 染 器 ， 如 果 
缺少 图 形 环 境 ， 则 需要 选用 AGG。 画 布 是 伴随 GUI ER, LE AGG jest HH 
器 。 所 以 在 Flask 环境 使 用 了 AGG 泻 染 器 ， 见 下 面 代码 。 


import matplotlib 


matplotlib.use('Agg") 
选用 非 GUI 后 端 ， 导 入 Figure 和 FigureCanvasAgg. Jf A StringIO, 用 于 模拟 写 入 文件 


import StringIO 
from matplotlib.backends.backend agg import FigureCanvasAgg as FigureCanvas 


from matplotlib.figure import Figure 


FigureCanvas 是 Figure 实例 的 容器 类 ，Figure 是 一 个 或 多 个 Axes 实例 的 容器 ， 包 含 与 
管理 某 个 图 形 的 所 有 元 素 ，Axes 是 包含 基本 单元 如 线 、 文 本 等 的 矩形 区 域 。 
下 面 是 fig 函数 的 完整 代码 ， level 参数 为 任务 等 级 。 


m 


II 


(Q)app.route(/fig/«level^") 
def fig(level): 
level =int(level) 
if level>4: 
level =4 
fig = Figure((8,8), dpi-50) 
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axis = fig.add_subplot(1, 1, 1) 
x 二 np.random.rand(level)# 位 置 随机 
y = np.random.rand(level) 


colors = ['blue', 'green', 'yellow', 'red'] 
axis.scatter(x,y,s=10000, color=colors[level-1], marker-(5,1)) 
canvas = FigureCanvas(fig) 

output = StringIO.StringIO() 

canvas.print png(output) 

response — make response(output.getvalue()) 
response.mimetype = 'image/png' 


return response 


axis = fig.add subplot(1, 1, 1) 函 数 返回 Axes 实例 ， 可 用 于 绘制 。 本 例 仅 生 成 一 个 Axis; 
所 以 只 有 一 个 绘图 区 域 。 

axis.scatter(x,y,s=10000，color=colors[level-1]，marker=(5,1)) 直 接 调 用 Axis 的 scatter FEX 
生成 五 角 星 图 形 。 

canvas = FigureCanvas(fig) 将 图 形 对 象 ( 后 端 独立 ) 与 FigureCanvas (Mifi) 联系 起 来 。 
canvas.print_png(output) 将 画布 中 的 图 像 写 入 文件 中 ， 本 例 使 用 StringIO 面向 内 存 的 类 文件 
作为 print png 输出 文件 。 

index.html 中 的 图 片 显示 部 分 代码 如 下 : 


«img src="{{ url for('fig',level = t.level) }}" alt=" 优 先 级 " height="40"> 


上 述 方法 是 采用 Matplotlib 动态 输出 图 像 ， 但 速度 比较 慢 ， 仅 用 于 小 型 并 确实 需要 动态 
图 像 的 系统 。 多 数 情况 下 是 采用 静态 图 片 方式 ， 可 采用 下 面 的 程序 组 织 结构 。 


my app/ 
- app.py 
- config.py 
- _ init .py 
- static/ 
- CSS/ 
- js/ 
- images/ 


- logo.png 


I 


对 应 


的 logo.png 文件 的 使 用 方法 是 : <img src-"/static/images/logo.png"». 


9.3.6 Flask-Script 


在 9.3.2 小 节 使 用 了 Flask-Script. Flask-Script 用 于 添加 一 个 命令 行 解释 器 ， 自 带 了 一 组 
常用 选项 ， 并 可 自 定 义 命令 。 下 面 是 Flask-Script 的 用 法 : 


from flask.ext.script import Manager 


manager = Manager(app) 
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@manager.command 
def createall(): 


db.create all() 


". 


if name ==" main 


manager.run() 


执行 todolistpy， 将 出 现 如 下 信息 ， 其 中 shell 功能 已 经 在 9.3.2 小 节 中 使 用 过 


usage: todolist.py [-?] (shell,createall,runserver] ... 


positional arguments: 


(shell,createall,runserver] 


shell Runs a Python shell inside Flask application context. 
createall 
runserver Runs the Flask development server i.e. app.run() 


optional arguments: 


-?, --help show this help message and exit 


中 createall 是 通过 如 下 方式 目 定 义 的 : 


N 
4 


(Q)manager.command 
def createall(): 


9.3/7 Flask 程序 运行 


网 络 编程 


Flask 提供 了 开发 Web 服务 器 ， 利 用 runserver 可 启动 Flask 的 开发 Web 服务 器 。 即 在 操 


作 系 统 命 令 行 输入 : 


python todolist.py runserver 


然后 在 本 地 计算 机 的 浏览 器 中 输入 : 


http://127.0.0.1:5000 


19] 


其 中 5000 是 Flask 的 开发 服务 器 的 默认 端口 。 运 行 结果 如 图 9-3 所 示 ， 该 图 中 Flask 的 logo 
为 静态 图 片 。 优 先 级 使 用 Matplotlib 动态 生成 的 图 像 表示 (图 中 的 五 角 星 个 数 )。 为 了 保证 程 
序 能 够 运行 ， 需 要 安装 相关 的 Flask 扩展 (Flask-SQLAlchemy、Flask-WTF、WTForms、 

Flask-Scrip ~ Flask-bootstrap ) 。 可 通过 pip install -r requirements.txt 进行 安装 。 其 中 
requirements.txt 在 本 节 工 程 文件 目录 下 。 


Python 即 学 即 用 


web development， 
one drop at a time 


优先 级 完成 否 任务 描述 终止 日 期 
* 完成 123 2015-05-25 BI | zi 
is 需要 加 油 234 2015-05-30 BIER | zii 
2 需要 加 油 456 2015-06-30 出 除 | zii 
.. 需要 加 油 789 2015-07-30 BIER | zii 


添加 新 的 待 办 事项 


内 容 
截止 日 其 
优先 级 |1 


图 9-3 待 办 事项 运行 图 


9.4 小结 


Python 的 网 络 应 用 非常 广泛 ， 从 访问 底层 操作 系统 的 Socket 接口 的 全 部 方法 ， 到 直接 
过 HTTP 或 者 IMAP 协议 进行 编程 ， 从 而 使 得 Python 可 用 于 编写 TCP/IP, UDP 程序 ， 也 
用 于 编写 email. FTP. CGI 程序 。 互 联网 + 正在 改变 传统 的 各 行 各 业 ， 目 前 大 家 谈 及 的 互 
联网 几乎 都 是 围绕 Web 技术 展开 的 ，Python 中 用 于 Web 的 框架 很 多 。 虽 然 Flask 属于 微型 
框架 ， 但 由 于 Flask 的 扩展 性 ， 使 得 它 适 合 学 习 研 究 、 生 产 环境 应 用 。 目 前 SAE、 阿 里 云 均 
提供 Flask 的 生产 环境 。 


z B 
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正则 表达 式 是 总 结 


的 通配符 ， 如 用 “ls 


进行 验证 。 


本 章 除 了 Python 正则 表达 式 的 re RIR, ANA 
HTML 或 XML 中 提取 信息 ， 是 一 款 优秀 的 解析 器 ， 并 支持 内 巷 的 了 


解析 功能 。 


各 个 语言 实现 的 J 
Perl 中 的 正则 表达 式 语法 接近 ， 可 借 


第 10 5€ 


10.1 Python 的 正则 表达 式 语 法 


正则 表达 式 (regular expression? 


符 串 是 否 


aA RAT 


e 区 分 〈 标 记 或 者 删除 


正则 表达 式 


个 文本 模式 的 表达 式 。 正 则 表达 应 
*py” È “dir *py” 来 列 出 扩展 名 为 “.py” 的 文件 。 
E 则 表达 式 语法 相互 之 间 稍 微 有 些 差 异 ，Python 的 了 
Hj Python 实现 的 kodos (http://kodos.sourceforge.net〉 软 


了 Beautiful 


用 的 常见 例子 是 大 多 数 操作 系统 


E 则 表达 式 语法 与 


HT), 


Soup 模块 ， 该 模块 月 


E 则 表达 式 ， 极 大 增强 了 


述 了 一 种 字符 串 匹 配 的 模式 ， 可 以 用 来 检查 一 个 字 


， 也 可 对 匹配 的 子 串 做 蔡 换 或 从 某 个 字符 串 中 取出 符合 某 些 条 件 的 子 
等 。 可 用 于 如 下 情况 : 


) 字符 串 中 重复 的 


IM, L 


子 付 ， 


例如 把 the computer book book 转 成 the 


computer book. 
e 将 所 有 单词 转换 为 标题 格式 ， 例 如 将 this isa Title 转换 为 This Is A Title. 
e 确保 句子 有 正确 的 大 小 写 。 
e i/i: URL. Email 地 址 拼写 无 误 。 
@ 身份 证 验证 。 
正则 表达 式 由 普通 字符 和 元 字符 组 成 。 普 通 字 符 是 指 常用 的 字符 ， 如 字母 、 数 字 、 汉 字 
等 。 元 字符 Cmetacharacter) 是 指 可 以 匹配 某 些 字符 形式 的 具有 特殊 含义 的 字符 ， 其 作用 类 
似 于 DOS 命令 使 用 的 通配符 ， 元 字符 主要 分 为 特殊 字符 和 符号 。 表 10-1 是 Python 正则 表 
达 式 的 常用 符号 。 
表 10-1 Python 正则 表达 式 的 常用 符号 
符 v &€@ Xx zm Ü f F 匹配 输入 不 匹配 输入 
匹配 任意 单个 字符 | ATTT Pica 5 T ZHK EC a > “A | s ATTTCTA 
匹配 以 AUG 开头 的 字符 串 。 
人 输入 文本 的 开头 "^AUG" | 即使 其 中 包含 AUG ， 但 不 以 * AUGAGC" * AAUGC" 
AUG 开头 也 不 匹配 
$ 输入 文本 的 结尾 “UAAS” EAE UAA, 其 余 位 | ¿AGCUAA” SOAM 


Python 即 学 即 用 


CHE) 
fj 号 " X 示 Bl 解 F 匹配 输入 不 匹配 输入 
可 以 重复 0 次 或 
* Š Esa n “ k” 包含 f 后 续 E AM “ m “A “ » 
多 次 的 前 导 字符 AT 含 A， 后 续 可 以 有 多 个 T AT A TT 
可 以 重复 1 次 或 mcm 
* 的 全 “AT*” 包含 AT， 后 续 可 以 有 多 个 T AT Z A? “TT” 
多 次 的 前 导 字符 TAT RAUAS 
j Ñ 可 以 重复 0 次 或 1 “AT” 包含 A, 后 续 可 跟 1 个 工 或 不 “A” HË “AT” “T” RË 
次 的 前 导 字 符 INT. AT, (EAJ A 不 匹配 TTA 


import re 


在 Python 中 ， 可 通过 下 面 的 方式 验 说 


t-re.match(" AT*","ATT") 


print (t.group()) 
可 以 用 表示 逻辑 或 的 
“AT "nm. 


CZ) 连接 了 


EX 10-1 以 及 后 续 的 内 容 : 


口 〈 方 括号 ): 表示 一 个 字符 集 。“[A-Z]” 


写字 母 或 数字 。 元 字符 在 正则 表达 式 集 
在 集 内 表示 所 示 字 符 的 补 集 。“[AR]” 将 匹 本 
个 字符 为 a 或 者 b， 第 二 个 字符 

{mn}: 表示 将 匹配 至 少 m X. Z n 次 了 


E I] 


内 不 起 作用 。“[*AT]” 将 


CL 除 了 “R” 的 任何 
为 c 或 者 d， 第 三 个 字符 为 e 或 者 f 的 字符 集 。 
E 则 表达 式 ，m<n。 例 如 , “(AT){3,5}” 将 匹 
Mu ^ATATTATATAT", 但 不 是 “ATATTATAT”。 没 有 m， 它 将 匹配 0 次 或 多 次 的 重复 ， 即 
“(AT){,5} ”形式 表示 最 多 匹配 5 次 ， 可 以 是 0 次 。 没 有 ns 将 


“(AT){3,}” 需 至 少 包含 3 个 AT， 例 如 “ATATAT”。 
(...): 匹配 在 括号 内 的 正则 表达 式 ， 表 示 一 组 的 开始 和 结束 。 要 匹配 的 文字 “(” 或 


^y", 需要 使 用 \( 或 )， 或 括 在 字符 类 中 [([)]。 
V RRR): 用 于 转 义 保留 字符 


匹配 


字符 如 “?”， 


ex" 
o 


线 作为 转 义 字符 ， 应 该 通过 一 个 原始 字符 串 表达 模式 来 使 用 它 。 


X 10-2 是 以 人 ”字符 


头 的 特殊 


Zr 


TI. 


表 10-2 Python 正则 表示 的 特殊 符号 


表达 式 。 例如 ATP 匹配 EAI uye uk 


匹配 任何 大 写字 母 ,“[a-z0-9]” 将 匹配 任何 小 


匹配 人 ee 或 ASK ^ 


— A 


字符 。[abj[cd][efl 将 本 


En AAA 
P 


[m 


匹配 m 次 以 上 的 所 有 重复 ， 


由 于 Python WEH cl 


符 ow * X 示 4 解 F 匹配 输入 不 匹配 输入 
\b 匹配 单词 的 边界 “Abthe” 以 the 开头 的 字符 the、they althe 
WIES LEE NE SARA VSNESEMISE 
M de 数字 字符 ， 相 | sedg 3 个 或 4 个 数字 的 字 | 123、9876 12、01023 
匹配 单个 非 数 字 字 符 ， 以 单个 非 数 字 字 符 开 头 ， aa、AA78、 
D Et \DGdj* p aAA . A342 
相当 于 [A0-9] 后 接任 意 个 数字 字符 品 : 1234 
匹配 单个 数字 、 大 小 写 NIE e 
: 以 3 个 数字 字符 开头 的 长 234abcd、12 
N FEE. THO T [0- \d{3}\w{4 E ORDRE ` 
" [Aa A MATIS 为 7 的 数字 字母 字符 串 。 | 345Pe NE 
匹配 单个 非 数 字 、 非 字 以 至 少 1 个 非 数字 、 字 母 
W 母 字符 ， 相 当 于 [^0-9a-zA- W-d(2) 字符 开头 ，2 个 数字 字符 结 329. $810 23, 3100 
zi 尾 的 字符 申 
EE 
AAZ) Mo 的 开始 ( 结 | naz 以 the 结束 的 字符 串 the they 
\s 匹配 任意 的 空白 符 ， 包 括 空 格 、 制 表 符 CTab) 、 换 行 符 、 中 文 全 角 空 格 竺 


表 10-3 给 出 正则 表达 式 的 一 些 常用 法 。 
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表 10-3 正则 表达 式 常用 法 


正则 表达 式 wo 
^[1-9]d*$ 匹配 正 整 数 
^-[1-9]d*$ 匹配 负 整 数 
^-2[1-9]d*$ 匹配 整数 
^[1-9N\d*|0$ 匹配 非 负 整数 〈 正 整数 和 0) 
^[0-9]*$ 限定 只 能 输入 数字 
^dín]$ 限定 只 能 输入 n 位 数字 
^d{m,n}$ 限定 只 能 输入 m-n 位 之 间 的 数字 
^[A-Za-z]+$ 匹配 由 26 个 英文 字母 组 成 的 字符 串 
^[A-Z]*$ 匹配 由 26 个 大 写 英文 字母 组 成 的 字符 串 
^[a-z]-$ 匹配 由 26 个 小 写 英文 字母 组 成 的 字符 串 
^[A-Za-z0-9]-$ 匹配 由 数字 和 26 个 英文 字母 组 成 的 字符 串 
Aw+$ 匹配 由 数字 、26 个 英文 字母 或 者 下 画 线 组 成 的 字符 串 
^[a-zA-Z]W (5,171$ 可 用 于 验证 密码 ， 限 定 了 以 字母 开头 ， 长 度 在 6 一 18 之 间 
[1-9] d (4,1 可 用 于 限定 输入 QQ 账户 
\d{3}-\d{8} M (41 7d (7) 匹配 国内 固定 电话 
Ww+([+.Jw+)*@w<+([-.JWw+)*Vw+([-.]Nv+)* 匹配 Email 地 址 
[a-zA-z] //[^s]* 匹配 URL 
[0-9]d (51 (2d) 匹配 中 国 邮 政 编码 ，6 位 数字 
\dAAdAA\dHA.\d+ 匹配 IP 地 址 
1\d{10} 匹配 国内 手机 号 码 


10.2 re 模块 


Python 的 re 模块 包含 以 下 方法 函数 : compile,search,findall,match。re 模块 提供 了 两 
种 使 用 正则 表达 式 的 方法 。 一 种 是 通过 表 10-4 中 的 方法 ， 直 接 返 回 结果 。 另 一 种 是 通过 
complile0 将 经 常 使 用 的 正则 表达 式 编译 成 正则 表达 式 对 象 ， 这 样 可 以 提高 效率 并 可 多 次 
调用 。 


表 10-4 Python 的 re 模块 方法 


JH ”法 说 — HJ 
match() 从 字符 串 起 始 处 匹配 
search() 扫描 整个 字符 串 ， 查 找 re 匹配 的 位 置 
findall() 查找 所 有 re 匹配 的 字符 串 ， 返 回 一 个 列表 
finditer() 查找 所 有 re 匹配 的 字符 串 ， 返 回 一 个 迭代 器 


10.21 Python 正则 表达 式 用 法 
一 个 基本 的 Python 正则 表达 式 用 法 如 下 : 


>>> import re 
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了 说 明 


py 
> 
ma 


>>> text-"Hello world, hello Python,hello you !"# 本 小 节 均 采用 该 字符 串 ; 
>>> myregex=re.search('hello',text) 


re 模块 中 的 search 需要 使 用 第 一 个 参数 作为 第 二 个 参数 的 模式 ， 并 在 第 二 个 参数 中 搜索 
第 一 个 参数 。 在 这 种 情况 下 ， 该 模式 可 以 被 翻译 为 “h 随后 由 ello 组 成 >。 当 找到 一 个 匹配 ， 
ee 
配 ， 返 回 None。myregex 的 返回 结果 可 通过 表 10-5 提供 的 函数 进行 处 理 。 


表 10-5 ”匹配 对 象 管理 函数 


方法 /属性 作 
group0 返回 被 te 匹配 的 字符 惠 
start() 返回 匹配 开始 的 位 置 
end0 返回 匹配 结束 的 位 置 
span() 返回 一 个 元 组 包含 匹配 (开始 ,结束 〉 的 位 置 
可 通过 group 显示 匹配 对 象 ， 以 及 span 显示 匹配 位 置 : 


>>> myregex.group() 
'hello' 

>>> myregex.span() 
(13, 18) 


group0 返 回 的 是 正则 匹配 的 字符 串 ， 而 span0 返 回 一 个 包含 匹配 的 〈 起 点 ， 终 点 ) 位 置 
元 组 (此 处 为 (13, 18))。 这 个 结果 与 字符 串 的 index 方法 返回 的 值 类 似 ， 例如 


>>> text.index('hello') 
13 


相 比 字符 串 的 处 理 方法 ， 正 则 表达 式 的 不 同 之 处 在 于 : 它 不 仅 可 以 处 理 纯 字符 串 ， 还 可 
以 处 理 组 合 。 例 如 ， 要 同时 匹配 “Hello” 和 “hello”: 


>>> myregex-re.search('[Hh]ello'text) 


第 一 个 匹配 返回 : 


>>> myregex.group() 
”Hello” 


text 字符 串 中 包含 了 一 个 Hello 和 两 个 hello， 但 通过 search 函数 仅仅 找到 一 个 Hello. 
为 了 找到 所 有 的 匹配 ， 需 要 使 用 re 模块 的 findall 函数 : 
>>> re.findall("[hHlello",text) 
[Hello, 'hello', 'hello'] 
与 search 不 同 的 是 : findal 返回 实际 匹配 的 列表 ， 而 不 是 匹配 对 象 。 如 果 希 望 返回 每 一 
个 匹配 的 对 象 ， 可 用 finditer 方法 。 它 不 会 返回 一 个 列表 ， 而 是 返回 一 个 从 代 器 。 


>>> re.finditer("[Hh]ello",text) 
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>>> myregex-re.finditer("[Hh]ello",text) 
>>> foriin myregex : 


print (i.group() ji.span() ) 


Hello (0, 5) 
hello (13, 18) 
hello (26, 31) 


match 方法 和 search 一 样 ， 但 它 只 是 从 字符 串 的 开始 进行 匹配 。 当 没有 模式 被 找到 ， 它 
返回 None。 


>>> myregex=re.match("hello",text) 

>>> print (myregex) 

None 

>>> myregex-re.match("Hello",text) 

>>> print(myregex) 

< sre.SRE Match object; span-(0, 5), match-'Hello' 


10.2.2. 编译 一 个 模式 


一 个 模式 可 以 通过 编译 变 成 一 个 内 部 的 表达 式 ， 从 而 提高 检索 的 速度 。 这 样 可 以 在 循 
环 中 更 有 效 地 使 用 正则 表达 式 。 当 重复 使 用 相同 的 表达 式 时 ， 编 译 过 的 正则 表达 式 使 执行 
加 速 。 但 如 果 正 则 表达 式 发 生 更 改 ， 则 这 种 编译 毫 无 益处 。 下 面 的 代码 演示 了 编译 模式 的 
应 用 : 


>>> a=Te.compile(\d) 
>>> s= "alb2c3" 

>>> a.findall(s) 

[1 2*3] 


10.2.3 ”模式 替换 
YE re 模块 中 ， 可 以 用 sub 函数 进行 模式 替换 。 函 数 用 法 : 


sub(rpl,str[,count=0]) 
把 rpl 替换 为 字符 串 〈str) 来 与 它 定 义 的 REGEX 一 臻 。 第 三 个 参数 是 可 选 的 ， 表 示 计 划 蔡 
k 

过 sub 可 实现 更 强大 的 替换 功能 。 例 如 下 面 的 字符 串 替 功能 


>>> strl="hello 111 word 111" 
>>> print (str1.replace("111","222" )) 
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hello 222 word 222 
>>> str2-"hello 123 world 456" 


对 于 su2 中 的 数字 ， 无 法 通过 字符 串 的 replace 功能 一 次 蔡 换 或 删 掉 。 但 通过 正则 表达 


式 的 sub 功能 可 实现 。 


下 面 代码 的 str3 演示 了 蔡 换 功能 ， 一 次 性 奉 换 了 所 有 数字 。 


>>> str3-re.sub(" d" "222" str2) 


下 面 的 代码 实现 了 删除 功能 。 


>>> str4=re.sub("\d+","",str2) 


10.3 ”高 级 话题 ， Beautitul Soup 


如 果 直 接 使 用 正则 表达 式 对 网 络 上 的 文档 进 
Beautiful Soup. Beautiful Soup 是 一 个 能 够 从 HTML 或 XML 文 伯 
n HT d XML 文件 分 析 。Beautiful Soup 支持 Python 标准 库 中 的 HTML 解析 器 ， 还 文 


fe^ —. 


持 一 些 第 三 方 的 解析 器 (lxml、html5lib)， 见 表 10-6. Beautiful Soup 支持 正则 表达 式 ， 弥 补 


了 其 部 分 功能 不 足 之 处 。 


行 解析 ， 工 作 量 是 非常 巨大 的 。 此 时 可 使 用 
F 中 提取 数据 的 Python FE, 


表 10-6 文本 解析 库 优 缺点 对 比 


解析 器 使 用 方法 优 点 
Python 的 内 置 标准 库 Python 2.73 (或 322) 
Python 标准 库 BeautifulSoup(markup,"html.parser") 执行 速度 适中 
文档 容错 能 力 强 
Ixml HTML 解析 器 BeautifulSoup(markup,"Ixml") 速度 快 
i 文档 容错 能 力 强 
Lg BeautifulSoup(markup.["Ixml", "xml"]) 速度 快 
Ixml XML 解析 器 BeautifulSoup(markup, xml") 唯一 支持 XML 的 解析 器 
最 好 的 容错 性 
html5lib BeautifulSoup(markup,"html5lib") 以 浏览 器 的 方式 解析 文档 
生成 HIML5 格式 的 文档 


目前 的 Beautiful Soup 版 本 为 4， 官方 已 经 将 Beautiful Soup 改名 为 bs4。 
Anaconda 包含 Beautiful Soup 4， 不 需要 再 安装 。 


FÆ Beautiful Soup 的 导入 方式 : 


from bs4 import BeautifulSoup 


下 面 以 获取 ETF 基金 份额 为 例 说 明 Beautiful Soup É 
ETF 份额 信息 ， 网 址 为 http:/www.sse.com.cn/assortment/fund/etf/diclosure/volumn - 
该 网 址 提供 信息 见 表 10-7〔 该 表 是 2015 年 07 月 29 日 获取 的 数据 内 


用 了 两 行 数据 内 容 )。 通 过 该 表 提 取 其 中 的 份 
文件 中 。 
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ii、 基 金 代 码 。 本 实例 所 有 代码 均 在 sse.py 


E 券 交易 所 网 站 提供 了 
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表 10-7 计划 读 取 内 容 


ETF 规模 
其 基金 代码 基金 简称 总 份额 〈 亿 份 ) 
2015-07-29 510010 治理 ETF 6.46 
2015-07-29 510020 超大 ETF 1.30 


因 网 站 存在 改版 等 情况 ， 在 本 书 代码 包 中 包含 了 一 份 对 应 的 磁盘 文件 ， 如 果 运 行 结果 不 
对 ， 请 对 照 书 中 的 分 析 过 程 检查 网 站 是 否 改动 ， 或 者 修改 代码 ， 改 成 打开 本 地 文件 〈 即 
etfhtml) 再 运行 即 可 。 

首先 通过 urllib2 库 读 取 数 据 ， 并 将 读 取 数据 传 给 Beautiful Soup， 获 得 一 个 BeautifulSoup 对 
5 soup: 


text = urllib2.urlopen('http://www.sse.com.cn/market/funddata/volumn/etfvolumn/').read() 
#text=open(r'./ETF.html').read() 

mysoup = BeautifulSoup(text) 

print(mysoup.original _ encoding)# 显 示 text 的 编码 

print (mysoup.prettify) 


代码 中 的 mysoup.original encoding 用 于 显示 编码 。Beautiful Soup 处 理 编码 的 优先 顺序 为 : 

e 创建 Soup 对 象 时 传递 的 fromEncoding 参数 。 

€ XML/HTML 文件 自己 定义 的 编码 。 

e 文件 开始 几 个 字 节 所 表示 的 编码 特征 ， 此 时 能 判断 的 编码 只 可 外 

UTF-*、EBCDIC 和 ASCII. 

e 如 安装 了 chardet E, Beautiful Soup 会 用 chardet 检测 文件 编码 。 

e UTF-8. 

€ Windows-1252. 

Beautiful Soup 把 HTML 文件 当 作 树 结构 的 对 象 。 有 四 种 对 象 : Tag, NavigableString, 
Beautiful Soup, Comment. Tag 对 应 HTML/XML 的 Tag 对 象 ， 也 是 Beautiful Soup 的 主要 
处 理 对 象 。 例 如 print (mysoup.title) 将 HTML 文件 的 Title 标签 输出 。 每 个 Tag 有 一 个 name 
属性 ， 用 于 输出 Tag 的 名 字 。 下 面 的 语句 将 输出 title: 


是 以 下 编码 之 一 : 


= 
CC 


print (mysoup.title.name) 
而 

print (mysoup.title.get text() ) 
将 输出 title 的 字符 串 内 容 。get_text0) 方 法 获取 tag 中 包含 的 所 有 文本 内 容 ， 包 括 子孙 tag 中 
的 内 容 ， 并 将 结果 作为 Unicode 字符 串 返 回 。 例 如 下 面 代码 中 的 mytest 的 a 标签 包含 i 标 


签 ， 通 过 mytestsoup.get_ text0 返 回 了 子 标签 的 文本 内 容 ，mytestsoup.i.get textO0 直 接 访问 了 i 
标签 的 文本 内 容 。 
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>>> mytest = <a href-"http://example.com/"7nl linked to <i>example.com</i>\n</a>' 
>>> mytestsoup-BeautifulSoup(mytest) 
>>> mytestsoup.get text() 
^nI linked to example.comWn' 
>>> mytestsoup.i.get text() 
'example.com' 


一 些 Tag 包含 多 个 属性 。 下 面 一 段 是 要 分 析 的 ETF 文件 的 内 容 : 


«link rel="stylesheet" type="text/css" href-"/ETF 规模 files/layout.css' 
«link rel="stylesheet" type="text/css" href-"/ETF 规模 files/style.css' 


«link href-"/ETF 规模 files/main menu blue.css" rel="stylesheet" type="text/css"> 
<link rel="stylesheet" type="text/css" href-" /ETF 规模 files/s suggest.css" 


link G$ rel. href. type 属性 。 通 过 类 似 字典 的 形式 ， 可 访问 Tag 属性 ， 例 如 : 


print mysoup.link 

print mysoup.link['href] 
print mysoup.link['rel'] 
print mysoup.link['type'] 


但 结果 好 像 差 一 点 儿 ， 上 面 代码 仅仅 给 出 了 第 一 个 “<link rel="stylesheet" type="text/css" 


href=" /ETF 规模 files/layout.css">” 的 对 应 内 容 。 为 了 能 够 访问 多 个 相同 Tag 的 内 容 ， 需 要 
使 用 find_all0 ,通过 如 下 代码 ， 可 获取 所 有 的 link 标签 的 内 容 。 


tags- mysoup.find_all('link') 
for tag in tags: 
print("href-", tag['href ],"rel-",mysoup.link['rel'],"type-", mysoup.link['type']) 


通过 查看 HTML 文件 的 源 文件 ， 发 现 ETF 规模 在 <table class="tablestyle"> 表 中 ，table 的 
class 的 class 属性 与 属性 值 是 判断 依据 。 
但 关键 字 class 在 Python 中 是 保留 字 ， 使 用 它 做 参数 会 导致 语法 错误 。 而 从 Beautiful 
Soup 的 4.1.1 版 本 开始 ， 可 以 通过 class. 参数 搜索 有 指定 class 的 tag， 例 如 : 


>>> mysouptest = BeautifulSoup('«p class="body strikeout"></p> «p >test</p>') 

>>> mysouptest 

<html><head></head><body><p class="body strikeout"></p> <p>test</p></body></html> 
>>> mydata=mysouptest.find all('p',class ="body strikeout") 

>>> mydata 


[<p class="body strikeout"></p>] 
对 表 10-7 的 处 理 方式 为 : 
tables-mysoup.find all("table",class ="tablestyle") 

一 个 Tag 可 能 包含 多 个 字符 串 或 其 他 的 Tag， 它 们 都 是 这 个 Tag 的 子 节点 。Beautiful 
Soup 提供 了 许多 操作 和 遍历 子 节 点 的 属性 。Table 是 一 个 典型 的 多 节点 的 Tag. Table 包含 了 
tr BJ Tag, M tr 又 包含 了 td， 即 一 个 表格 是 由 行 、 列 组 合 而 成 的 。 下 面 的 代码 读 取 ETF 规模 
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的 数据 ， 即 处 理 表 格 例子 


tables=mysoup.find all("table",class ="tablestyle") 


for table in tables: 
for row in table .find all("tr") 
for tr in row.find all("td"): 
print (re.sub("s","" tr.get textO))# 去 掉 空 


至 此 ， 完 成 了 读 取 ETF 份额 的 工作 。 读 者 可 结合 pandas 对 采集 到 的 数据 做 进 一 
分 析 。 
但 如 果 存 在 网 站 改版 情况 ， 表 格 属 性 有 可 能 变化 ， 读 者 可 分 析 HTML 的 源 文 件 ， 了 解 其 
table 属性 与 其 他 table 属性 的 差异 ， 以 此 作为 提取 table 数据 的 依据 。 

上 述 HTML 格式 比较 规整 ， 通 过 Beautiful Soup 解析 数据 也 无 歧义 。 但 如 果 存 在 下 面 的 
HTML 内 容 : 


di 
m3 


testdata=""" 
<div class="icon_col"> 
«hl class="hluser">123</h1> 
«hl class="hluserl">456</h1> 
«hl class="hluser2">789</h1> 


</div> 


"mum 


如 果 使 用 上 面 介绍 的 class 方法 ， 即 : 


mysouptest-BeautifulSoup(testdata) 
mysoupdatal-mysouptest.find all('hl'class ='hluser') 
print( mysoupdatal ) 


仅 能 获取 <hl class="hluser">123</h1> 的 数据 ， 为 此 Beautiful Soup 引入 正则 表达 式 用 于 处 理 
此 类 歧义 问题 

可 在 find alioi 数 中 直接 传 入 正则 表达 式 ， 例 如 find_all(re.compile("^b") 会 搜索 所 有 以 b 
开头 的 标签 ，class ”参数 也 可 直接 传 入 正则 表达 式 ， 例 如 : 


mysoupdata2 = mysouptest.findAll(name-"h1", class_=re.compile(r"hluser(\s\w+)?") ) 
print( mysoupdata2 ) 
for mydata in mysoupdata2: 

print (mydata.attrs mydata.text ) 


通过 上 面 代码 可 以 搜索 到 所 有 以 hluser 开头 的 class 属性 。mydata.attrs 输出 了 所 有 属 
运行 结果 如 下 : 


[<hl class="hluser">123</h1>, «hl class="hluserl">456</h1>, <hl class="hluser2">789</h1>] 
{'class': [hluser]} 123 

{'class': [hluserl']} 456 

{'class': ['h1user2']) 789 
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10.4 小结 


本 章 介绍 了 正则 表达 式 以 及 Python 的 re 模块 用 法 。 
将 正则 表达 式 用 于 HTML 文档 解析 属于 比较 基础 的 工作 ，Python 提供 了 HTMLParser 
实现 该 功能 ， 并 有 其 他 的 各 种 实现 版 本 。Beautiful Soup 是 以 HTMLParser. 为 基础 的 
Html/XML 解析 器 ， 在 10.3 节 介 绍 了 如 何 通过 Beautiful Soup 获取 数据 。 


TAA d 


c 
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人 机 交互 方式 主要 有 字符 终端 和 民 


pa 


ÉR 面 两 种 


白字 几乎 成 了 
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D Aro 


FT 


端的 特征 ， 


目 


前 高 校 存 在 的 BBS 终端 版 、Windows 下 的 命令 提示 符 、Linux 下 的 终端 均 属 于 字符 终端 形 


式 ，Python 的 print 5 input(raw inpub 实 现 了 字符 输入 / 输 
Flask 一 节 给 出 的 借助 浏览 器 Web 交互 方式 ， 还 有 


构 程序 的 界面 设计 。 


可 


id Windows. 


Tkinter 包含 于 Python 标准 发 行 包 中 ， 
Linux, Macintosh 系统 


Qt 是 一 个 跨 3 
Qt 不 仅 是 一 个 图 
WebKit 等 库 。 


F 台 的 应 月 


HEU 28 


Designer 进行 可 视 化 界面 设计 。 


Python 下 的 GUI 另 有 跨 平 台 的 PyGTK 可 支持 GNOME 


上 的 GUI 


因此 ，PyQt 也 不 仅仅 是 GUI， 而 且 


GUI Jë wxWidgets 的 Python 封装 wxPython。 


11.1 Tkinter 


Tkinter 随 标 准 Python 版 本 发 布 ， 
言 中 均 有 相应 ， IDLE WE] 
学 习 Tkinter 可 熟悉 其 他 GUI 的 使 用 方法 。 


GUI 的 特征 ， 通 


11.1.1 Tkinter 


Tkinter 的 GUI | 
标签 (Label)、 复 选 框 


组 件 


(Checkbox), # 


>>>from Tkinter import * 


>>>root=T 


即 可 创建 一 个 顶级 窗口 。 
窗口 。 
为 了 显示 “Hello Word", 


出 现 一 个 空 


kO 


是 基于 Tk 的 工具 集 


种 GU 


在 Tcl/Tk GUI 库 之 | 


Tkinter J 


一 些 组 件 (Widget) 构成 。 主 要 有 : 文本 框 
EAR (Frame) 等 。 在 Python 提示 符 下 输入 以 下 命令 : 


顶级 窗口 可 包含 所 有 的 小 窗口 对 象 ， 


输入 如 下 命令 


>>>mylabel=Label(root,text="Hello World") 


要 创建 一 个 组 件 实例 ， 


widget (Parent, ...) 


方式 如 下 : 


包含 各 种 应 用 程序 


桌面 系统 的 


H 


出 程序 。 图 形 界 面 除 了 第 
I 方式 ， 用 于 实现 本 地 或 者 C/S 55 


EI H 前 在 Perl、 


于 发 的 。Tkinter HÑ fB 


;9 


上 提供 了 一 个 面向 对 象 的 层 


章 的 


Zx 9 


A, PyQt 是 对 Qt 的 Python 封装 ， 提 供 了 Python 接口 。 
形 库 ， 还 包含 了 数据 库 、OpenGL 库 、OpenVG、SVG、 多 媒体 库 、XML、 


库 ， 并 且 可 利 


开发 ， 以 及 对 跨 平台 


i Qt 
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(TextBox), #Zz#H (Button), 


并 习惯 定义 成 “root”。 这 时 会 


Python 即 学 即 用 


即 在 创建 新 的 组 件 实例 时 ， 同 时 与 父 组 件 关联 。 上 面 的 mylabel 与 root 关联 。 
>>>mylabel.pack() 
mylabel.packO 进 行 组 件 的 布局 管理 ， 管 理 和 显示 组 件 。 如 果 不 执行 pack， 将 看 不 到 任何 
组 件 。Tkinter 提供 了 三 种 布局 管理 方式 :pack、grid、place。 
>>>root.mainloop() 
mainloop 是 主事 件 循 环 ， 是 一 个 无 限 循环 ， 一 直 等 待 事件 〈 见 11.1.2 小 节 )。 如 果 事 件 
发 生 ， 处 理 完 毕 继续 循环 等 待 下 一 个 事件 。 一 直 等 待 到 主 窗口 的 关闭 事件 。 
程序 运行 结果 如 图 11-1 所 示 。 


可 见 ，GUI 开发 过 程 是 : TUE 加 
1) 导入 Tkinter 模块 。 
2) 创建 一 个 顶级 窗口 ， 用 于 容纳 所 有 的 组 件 。 图 11-1 Tkinter 标签 组 件 


3) 创建 相应 的 组 件 实例 ， 使 用 顶级 窗口 或 者 组 件 容 器 作为 父 
组 件 ， 并 设置 相应 的 属性 ， 以 及 设 定 组 件 的 布局 。 
4) 关联 组 件 的 事件 或 者 命令 ， 便 于 响应 用 户 操作 或 者 其 他 触发 源 的 请 求 。 
5) 执行 主 循环 。 
设置 组 件 属 性 的 方法 ， 除 了 上 面 提 及 在 创建 实例 时 的 直接 参数 赋值 方式 〈 即 
mylabel-Label(root,text-"Hello World 几 语句 )， 还 有 两 种 方法 : 
D 采用 字典 形式 ， 添 加 相应 的 属性 值 。 例 如 : 
>>> mylabell-Label(root) 
>>> mylabell['text']-"test1" 


2) 使 用 config0 函 数 更 新 多 个 属性 值 。 例 如 : 


>>> mylabel2=Label(root) 
>>> mylabeD.config( text ="test2") 


mylabel 调用 了 packO 进 行 布局 。pack0 的 用 法 如 下 : 


i 


widget.pack( 可 选 参数 ) 


可 选 参数 有 : 

€ expand: 当 值 为 “yes” 时 ，side 选项 无 效 。 组 件 显示 在 父 组件 中 心 位 置 。 

e fill: 填充 x(y) 方 向 上 的 空间 ， 当 属性 side= “top” I “bottom” I, HA x 方向 ; 当 

属性 side=“left” 或 “right” 时 ， 填 充 “y” 方 向 ; 当 expand 选项 为 “yes” 时 ， 填 充 
父 组 件 的 剩余 空间 。 

@ side: 定义 停靠 在 父 组 件 的 哪 一 边 上 。 取 值 范 围 是 “top”“bottom” “left” “right”, 
默认 为 “top”。 

下 面 是 一 个 多 个 组 件 调用 pack 的 例子 。 


>>> from Tkinter import * 
>>> root = Tk() 

>>> frame = Frame(root) 
>>> frame.pack() 
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>>> bottomframe = Frame(root) 

>>> bottomframe.pack( side = BOTTOM ) 

>>> redbutton = Button(frame, text-"Red", fg-"red") 
>>> redbutton.pack( side = LEFT) 

>>> bluebutton = Button(frame, text-"Blue", fg-"blue") 
>>> bluebutton.pack( side = LEFT ) 


>>> greenbutton = Button(bottomframe, text-"Green", fg-"green") 

>>> greenbutton.pack( side = BOTTOM) 

>>> root.mainloop() 

运行 结果 如 图 11-2 所 示 。 
表 11-1 给 出 了 Tkinter 的 组 件 描述 。 图 11-2 pack 用 法 
表 11-1 Tkinter 组 件 
组 fF Hi XS 

Button 按钮 ， 用 来 执行 一 个 命令 或 其 他 操作 
Canvas 画布 ， 用 来 绘制 图 标 和 图 形 , 创建 图 形 编辑 器 
Checkbutton 选择 按钮 ， 表 示 一 个 具有 两 个 不 同 (或 相反 〉 值 的 变量 ， 点 击 按钮 在 这 两 个 值 间 切 换 
Entry 文本 框 
Frame 组 件 容 器 ， 可 以 有 边框 和 背景 色 ， 用 来 在 应 用 程序 或 对 话 框 中 将 组 件 分 组 管理 
Label 标签 ， 用 来 显示 文字 和 图 片 
Listbox 列表 框 ， 用 户 可 从 中 选择 
Menu 菜单 ， 可 实现 下 拉 式 或 层 钱 式 菜单 
Menubutton 菜单 按钮 ， 用 来 实现 下 拉 菜 单 
Message 消息 框 ， 显 示 一 串 文字 。 和 Label 组 件 相 似 ， 但 是 可 以 自动 根据 宽度 和 宽 高 比 进行 文本 换行 
Radiobutton 单 选 枉 ， 有 具有 多 个 选项 ， 但 是 在 一 个 时 刻 只 能 有 一 个 值 被 选中 
Scale 进度 条 ， 人 允许 创建 一 个 可 以 通过 拖 动 滑动 条 来 改变 一 个 数值 的 组 件 
Scrollbar 标准 滚动 条 ， 与 Canvas, Entry, Listbox 和 Text 组 件 结合 使 
Text 格式 化 文本 显示 ， 人 允许 使 用 多 种 分 隔 和 属性 显示 和 编辑 文字 ， 也 支持 内 嵌 图 片 和 窗 
Toplevel 容器 组 件 ， 用 来 创建 子 窗 


表 11-1 中 提 到 Frame 是 一 个 容器 组 件 。Frame 可 进行 窗 休 布局， 负责 安排 其 他 组 件 的 
位 置 ， 是 一 个 常用 的 实现 布局 功能 的 组 件 。 用 法 如 下 : 


myFrame=Frame(myParent,option,...) 


Tr 


其 中 ，myParent 表示 父 窗口 。option EHA background. borderwidth. height. width 等 
性 。 
下 面 是 一 个 使 用 frame 作为 容器 的 例子 。 
>>> from Tkinter import * 
>>> root = Tk() 


>>> frame = Frame(root) 


>>> frame.pack() 


l 
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>>> bottomframe = Frame(root) 

>>> bottomframe.pack( side = BOTTOM,expand=True ) 
>>> Labell = Label(frame)#, text="Red", fg-"red") 

>>> Labell["text"]-"Label1" 

>>> Labell.pack( side = LEFT) 

>>> Label2 = Label(frame)# 

>>> Label2.config( text="Label2", fe="brown") 

>>> Label2.pack( side = LEFT ) 

>>> Label3 = Label(bottomframe, text-"Label3", fe-"black") 
>>> Label3.pack( side = BOTTOM) 

>>> root.mainloop() 


图 11-3 是 运行 结果 。 
采用 类 设计 可 避免 大 量 使 用 全 局 变量 ， 下 面 是 使 用 类 方式 设计 的 GUI 程序 。 该 程序 在 
创建 MyApp 时 创建 了 相应 的 组 件 实例 。 该 程序 运行 结果 显示 一 个 "Hello, World!" 的 按钮 。 


from Tkinter import * 


% tk ee 
class MyApp: 


def init (self, myParent): pun p 
self.buttonl = Button(myParent) — 


self.buttonl["text"]- "Hello, World!" 
self.buttonl ["background"] = "green" 
self.button1.pack() 

root = Tk() 

myapp = MyApp(root) 

root.mainloop() 


下 面 将 介绍 如 何 使 按钮 动 起 来 。 


d 


图 11-3 Frame 用 法 


11.1.2 Tkinter 回调 、 绑 定 
按钮 是 常用 的 组 件 ， 用 于 对 鼠标 和 键盘 事件 进行 响应 。 按 钮 的 基本 用 法 如 下 : 


W-tk.button(parent,option-value,..) 


按钮 的 主要 属性 Coption 参数 ) 见 表 11-2. 


表 11-2 Button 属性 


属 性 说 HJ 

activebackground, activeforeground 按钮 被 激活 时 所 使 用 的 颜色 

background (bg), foreground (fg) 按钮 的 颜色 

bitmap 显示 在 窗口 部 件 中 的 位 图 

command 当 按 钮 被 按 下 时 所 调用 的 一 个 函数 或 方法 。 所 回调 的 可 以 是 一 个 函数 、 方 法 或 别 

的 可 调用 的 Python 对象 

text 显示 在 按钮 中 的 文本 。 文 本 可 以 是 多 行 

width, height 按钮 的 尺寸 。 如 果 按 钮 显示 文本 ， 尺 寸 使 用 文本 的 单位 。 如 果 按 钮 显示 图 像 ， 尺 
; 寸 以 像素 为 单位 
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按钮 被 点 击 时 ， 会 做 出 相应 的 响应 动作 。Tkinter 中 可 通过 事件 绑 定 和 命令 绑 定 两 种 方式 
响应 请 求 。 

首先 介绍 命令 方式 。 该 方式 与 11.1.1 小 节 中 使 用 的 Button 差别 在 command 参数 。 在 下 
在 的 代码 中 ， 按 钮 通过 command 参数 传递 相应 动作 (chll-1.py)。 


from Tkinter import * 
root =Tk() 
def callfunction(): 
print " button hello" 
Button(root, text-"Change", command-callfunction).pack() 
root.mainloop() 


command 的 值 是 函数 对 象 〈callfunctiom， 即 回调 。 该 过 程 是 事件 驱动 编程 的 典型 应 
用 ， 按 下 鼠标 、 敲 键盘 等 用 户 操作 引起 应 用 程序 响应 都 属于 事件 驱动 。 

需要 注意 : command 赋值 的 是 函数 对 象 ， 如 果 需 要 对 回调 函数 传送 参数 ， 可 使 用 偏 函 数 
形式 ， 当 然 也 可 用 lamdba， 如 下 面 的 一 些 lamdba:callback0O 形 式 。 即 ; 

e 如 回调 不 需要 传递 参数 ， 则 使 用 command-callback 或 者 command=lambda:callback0 形 式 。 

e 如 回调 需要 传递 参数 ， 只 能 使 用 command=lambda:callback(argv...) 形 式 。 

示例 如 下 : 


def callfunctionwithParm(a): 
print "hello",a 
Button(root,text-"With parm",command-lambda:callfunctionwithParm("parm")).pack() 


Timothy R. Evans 提出 ， 可 以 把 被 调用 函数 、 参 数 封 装 成 可 调用 类 。 代 码 如 下 ; 


class Command: 

def init (self func,*args,**kw): 
self.func-func 
self.args-args 
self.kw-kw 

def call (self*args,**kw): 
args-self.args-args 
kw.updata(self.kw) 
apply(self.func,args,kw) 


被 传递 给 apply 的 函数 和 参数 〈 包 括 关 键 字 ) 包含 在 类 的 构造 器 中 。 相 应 的 调用 形式 
如 下 : 


Button(text="Command Class",command=Command(callfunctionwithParm, "this Command Class"  ))pack() 


程序 运行 结果 如 图 11-4 所 示 。 

绑 定 是 在 组 件 、 事 件 、 回 调 之 间 建 立 关 联 。 当 在 组 件 上 出 现 鼠 标 
点 击 、 按 键 等 动作 时 ， 应 用 程序 通过 绑 定 对 此 作出 响应 。 其 中 鼠标 点 
击 、 按 键 或 窗口 管理 器 的 重新 绘制 均 为 事件 ， 绑 定 的 形式 是 : Command Class 


Bl 


widget.bind(event, handler) 图 11-4 “按钮 回调 实例 
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其 中 handler 类 似 回 调 ， 但 包含 
甫 获 鼠 标 位 置 演 示 绑 定 的 用 法 。 
import Tkinter as Tk 


root = Tk.Tk() 
def eventhandler(event): 


Ilii 
um 
— 


于 件 参数 。 下 面 的 例子 代码 为 ch11-2.py) 通过 Frame 


print "点 击 坐 标 ", event.x, event.y,event. 
frame = Tk.Frame(root, width=100, height=100) 
frame.bind("<Button-1>", eventhandler) 
frame.pack() 
root.mainloop() 
frame.bind 将 eventhandler 绑 定 到 <Button-1> 上 ， 同 时 eventhandler 的 函数 与 回调 区 别 在 
于 event 参数 ， 即 event 参数 可 以 传递 事件 的 属性 。 主 要 有 : 
€ widget: 产生 事件 的 组 件 。 这 是 一 个 合法 的 Tkinter 组 件 实例 ， 而 不 是 一 个 名 字 。 所 
有 的 事件 都 归于 此 类 。 
xy: 当前 的 鼠标 位 置 ， 单 位 为 像素 。 
x root,y root: 当前 鼠标 位 置 相对 于 屏幕 左上 角 的 位 置 
char: 字符 代码 〈 仅 键盘 事件 ) 字符 串 的 格式 。 
keysym: 按键 特征 〈 仅 键盘 事件 )。 
keycode: 按键 代码 〈 仅 键盘 事件 )。 
num: 按钮 数字 〈 仅 鼠标 按键 事件 )。 
width, height: 组 件 的 宽度 和 高 度 〈 仅 configure 事件 
€ type: 事件 类 型 。 
除了 <Button-1> 还 有 <B1-Motion> <ButtonRelease-1>, <Enter>, <Double-Button-1>, 
<Leave>、<FocusIn>、<FocusOut>、<Return>、<Key> 等 事件 ， 可 配合 不 同 组 件 功能 使 用 


例如 Entry 组 件 可 使 用 <Enter> 表 示 输 入 完 数据 后 回 车 即 执行 功能 。 
11.1.3 ”Matplotlib 应 用 于 Tkinter 


Matplotlib n] HIŠA] GUI 中 。 本 节 通 过 一 个 查询 股票 行情 的 实例 演示 如 何 将 
Matplotlib X ^ fl] Tkinter 中 。 
Matplotlib 程序 包含 一 个 前 端 ， 也 就 是 面向 用 户 的 一 些 代码 ， 如 plot()。 并 包含 一 个 后 
端 ， 用 于 实现 绘图 和 不 同 应 用 之 间 的 接口 。 通 过 改变 后 端 可 将 图 像 绘制 到 PNG. PDF. SVG 
等 格式 文件 上 或 者 输出 到 Web. GUI 环境 中 。 为 了 与 Tkinter 配合 使 用 ， 需 要 将 后 端 设置 成 
TkAgg， 即 matplotlib.use('TkAgg')， 然 后 通过 如 下 代码 ， 将 Matplotlib 的 Figure 与 Tkinter 的 
画布 (Canvas) 关联 起 来 ， 即 可 将 Matplotlib 的 绘图 结果 直接 呈现 在 Tkinter 的 画布 中 。 


Im- 


位 为 像素 。 


` 


T 
NM 
o 


from matplotlib.backends.backend tkagg import FigureCanvasTkAgg 
from matplotlib.figure import Figure 

 redraw.f —Figure(figsize-(5,4), dpi-100) 

 redraw.canvas — FigureCanvasTkAgg( redraw.f, master-root) 


下 面 是 完整 代码 (ch11-3.py)。 通 过 StockCode = Tk.Entry(root)-5 toIN = int(StockCode.get()) 
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获取 用 户 输入 值 并 转换 成 整 型 数据 ， 通 过 quotes historical yahoo 函数 获取 对 应 的 深 证 股票 
的 历史 记录 。 通 过 Matplotlib 的 plot date 函数 绘制 图 形 ， 并 通过 _redraw.canvas.show() 与 
_redraw.canvas.get tk_widget().pack() 把 图 形 显示 在 TKinter 的 画布 中 。 


L 


import matplotlib 
matplotlib.use('TkA gg") 
from matplotlib.backends.backend tkagg import FigureCanvasTkAgg 
from matplotlib.figure import Figure 
from matplotlib.finance import quotes historical yahoo 
import datetime 
import sys 
ifsys.version info[0] « 3: 
import Tkinter as Tk 
else: 
import tkinter as Tk 
root = Tk.Tk() 
datel = datetime.date( 2013, 1,1) 
date2 = datetime.date( 2013, 12, 12 ) 
def getInputs(): 
try: 
tolN = int(StockCode.get()) 
except: 
toIN = 000001 
if toIN«600000: 
toIN-StockCode.get()-" .sz' 
else : 
print u C Sc FEZR UE 
return toIN 
def redraw(): 
 redraw.£.clf() 
quotes = quotes historical yahoo( getInputs(), datel, date2) 


if len(quotes) == 0: 
raise SystemExit 

dates — [q[0] for q in quotes] 

opens = [q[1] for q in quotes] 

fig —Figure(figsize-(5,4), dpi-100) 

ax = redraw.fadd subplot(111) 

ax.plot date(dates, opens, '-') 

 redraw.canvas.show() 

 redraw.canvas.get tk widget().pack(side- Tk. TOP, fill- Tk. BOTH, expand-1) 
 redraw.f —Figure(figsize-(5,4), dpi-100) 
 redraw.canvas = FigureCanvasTkAgg( redraw.f, master-root) 
button = Tk.Button(master-root, text-'redraw', command- redraw) 
button.pack(side- Tk.BOTTOM) 
Tk. Label(root, text-u" Jt 4:4 V13").pack(side-Tk. TOP) 
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StockCode = Tk.Entry(root) 


StockCode.pack() 
StockCode.insert(0,000001") 
 redraw() 
Tk.mainloop() 
图 11-5 是 该 例子 的 运行 结果 。 
Tá tk E m 


股票 代码 


6.0 n ñ n " n n L š n P Š 
Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun2013 Jul2013 Aug 2013 Sep 2013 Oct2013 Nov 2013 Dec 2013 


图 11-5 Matplotlib 应 用 于 Tkinter 


11.2 高 级 话题 Pyli 


11.2.1 PyQt 介绍 


如 果 觉 得 Tkinter 功能 不 够 丰富 ， 可 考虑 PyQt. Eric 是 基于 PyQt 的 IDE, IDLE 是 基 
于 Tkinter 的 IDE， 不 妨 从 http://eric-ide.python-projects.org/ 下 载 Eric; E IDLE 作 一 下 对 比 ， 
会 发 现 Eric 有 更 多 的 功能 以 及 界面 风格 。 

PyQt 是 Python 编程 语言 和 Qt 库 的 成 功 融 合 。Qt 是 一 个 跨 平 台 应 用 程序 和 UI 开发 框 
W. WEH Qt， 只 需 一 次 性 开发 应 用 程序 ， 无 须 重新 编写 源 代码 ， 便 可 在 不 同 桌 面 和 嵌入 式 
操作 系统 中 部 署 这 些 应 用 程序 。 目 前 Qt 支持 Windows. Linux. Android. iOS, Mac OS X 
系统 。Qt 可 从 http://download.qt.io/official releases/qt/ 下 载 。 

Qt Creator 是 全 新 的 跨 平 台 Qt IDE， 可 单独 使 用 ， 也 可 与 Qt 库 和 开发 工具 组 成 一 套 完 
整 的 SDK。 其 中 包括 : 高 级 C++ 代码 编辑 器 、 项 目 和 生成 管理 工具 、 集 成 的 上 下 文 相关 的 
帮助 系统 、 图 形 化 调试 器 、 代 码 管理 和 浏览 工具 。 

PyQt 包含 了 大 约 440 个 类 、6000 多 个 函数 和 方法 。PyQt 已 经 不 局 限于 GUI 功能 ， 它 对 
数据 库 、XML、SVG 等 领域 均 有 较 好 的 库 文 持 。 目 前 存在 两 个 版 本 的 PyQt， 即 PyQt4 与 
PyQt5, PyQt4 支持 Qt4，PyQt5 支持 Qt5。 


山 | 
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PyQt 可 从 https://www.riverbankcomputing.com/software/pyqt/download 下 载 ， 本 节 以 


PyQt 4 为 基础 进行 讲解 。 


下 面 介 绍 PyQt 的 主要 功能 模块 。 


QtCore 模块 主要 包含 了 一 些 非 GUI 的 基础 功能 ， 包 含 事 件 循环 与 Qt 的 信号 机 制 。 


此 外 ， 还 提供 了 路 平台 的 Unicode、 线 程 、 内 存 映 射 文件 、 共 享 内 存 、 正 则 表达 式 功能 和 


用 户 设置 。 


QtGui 模块 包含 了 大 多 数 的 GUI 类 型 。 
基于 MVC 设计 模式 的 列表 、 表 格 、 树 型 控 作 
的 画布 控件 ， 其 中 可 以 放置 各 种 控件 和 图 形 。 此 外 ，QtGui 还 支持 界面 动画 编程 。 


QtNetwork 模块 可 以 用 于 编写 非 阻 


FTP 的 客户 端 。 


包含 按钮 、 文 本 框 、 列 表 等 常见 控件 ， 还 包含 了 


F。 同 时 还 提供 了 一 个 能 够 容纳 成 于 上 万 个 元 素 


I UDP, TCP 程序 。 还 包含 了 DNS, HTTP 与 


QtOpenGL 模块 允许 Qt 程序 使 用 OpenGL È% 3D 图 形 。 
QtSql 模块 支持 多 种 SQL 数据 库 。 包 括 SQLite. ODBC, MySQL. PostgreSQL 、 


Oracle。 还 提供 了 一 个 基于 MVC 模式 的 数据 模型 ， 与 QtGui 的 表格 控件 配合 使 用 。 


QtXml 包含 一 个 XML 解释 器 ， 同 时 支持 SAX 和 DOM 两 种 编程 方式 。 
QtWebkit 与 QtScript 两 个 子 模块 支持 WebKit 与 EMCAScript 脚本 语言 。 


Uic 子 模块 能 够 将 Qt 的 窗 体 文 伯 


示 出 来 。 它 依赖 于 QtXml 模块 。 


F 转 换 为 Python 代码 ， 能 够 即时 读 入 窗 体 文件 并 且 显 


QScintilla 子 模块 包含 一 个 基于 Scintilla 的 文本 编辑 器 控件 ，Eric IDE 使 用 它 作为 代码 


QtMultimedia 提供 了 底层 的 多 媒体 文 持 ， 现 在 多 数 开发 者 改 用 Phonon 模块 。 


QtSvg 支持 SVG 1.2 Tiny 的 前 
本 节 采 用 与 Tkinter 相同 的 讲解 过 程 讲解 
件 响应 。 下 面 是 控件 的 显示 代码 代码 文人 


# 导 入 Qt 的 类 


态 标准 ， 


] 于 显示 与 保存 SVG 格式 的 图 形 。 


PyQt， 即 首先 创建 显示 控件 ， 然 后 处 理 控件 事 


为 ch11-4.py)。 


from PyQt4.QtGui import QLabel,QApplication 


# 使 用 from import 导入 方式 ， 所 有 


App-QApplication(sys.argv) 


Label-QLabel("hello world") 
#QLabel 是 标签 函数 
Label.show() 


"ERAS Qt 应 用 程序 都 必须 有 且 只 有 : 


# 探 件 被 创建 时 ， 默 认 是 不 显示 的 ， 必 须 调 


sys.exit( App.exec ()) 


^ * QApplication 对 象 ,其 参数 为 sys.arfgv， 便 于 程序 处 理 命 


的 Qt 对 象 名 称 均 以 Q 开头 


AP 


] showO0 函 数 来 显示 它 。 


# 调 用 QApplication 的 exec_0 方 法 ， 程 序 进 入 消息 循环 ， 等 待 可 能 输入 进行 响应 。Qt 完成 事件 处 


理 及 显示 的 工作 ， 


3 


运行 结果 如 图 11-6 所 示 。 


F 在 应 用 程序 退出 时 返回 exec. OR 


值 。 不 要 与 Python 的 exec 混淆 。 
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g [cassis 


hello world 


zl 


-EXSPI- TRUM T UE, (068 


继承 了 QtGui.QWidget, QWidget 类 是 所 有 


E 


mL 


import sys 

from PyQt4 import QtGui 

class Example(QtGui.QWidget): 
def init (sel£parent-None): 


QtGui.Q Widget. init (self,parent) 


self.setWindowTitle('testin 
label = QtGui.QLabel('hell 
label.move(15,10) 
self.resize(250, 150) 


app = QtGui.QApplication(sys.argv) 
ex = Example() 

ex.show() 

sys.exit(app.exec () 


图 


11-7 是 执行 结果 。 


g’) 
o ',self) 


| 11-6 PyQt Hello World 

用 的 是 类 的 方式 ， 下 面 是 改写 的 类 方式 。 
户 界面 对 象 的 基 类 。 从 窗口 系统 接收 鼠标 、 键 
和 其 他 事件 ， 并 且 在 屏幕 上 绘制 。 每 一 个 窗口 部 件 都 是 矩形 。 代 码 文件 为 ch11-5.py。 


ENE 


` 


H Example 


n 
E] testing 


hello 


图 11-7 PyQt 的 类 用 法 


同 Tkinter 一 样 ，Qt 中 的 布局 管理 器 也 是 编程 中 的 重要 部 分 ， 用 于 在 窗口 中 安排 部 件 位 
置 。 布 局 管理 有 两 种 工作 方式 : 绝对 定位 方式 〈absolute positioning) 和 布局 类 方式 (layout 
class)。 上 例 中 的 labell 采用 了 绝对 定位 方式 。 但 绝对 定位 方式 需要 程序 员 指 定 每 个 部 件 的 
位 置 和 尺寸 像素 ， 在 使 用 时 有 以 下 次 端 : 

e 改变 窗口 大 小 时 ， 窗 口中 部 件 的 大 小 和 位 置 不 会 随 之 改变 。 

e 在 不 同 的 平台 上 ， 应 用 程序 可 能 会 看 起 来 不 相同 。 

e 在 应 用 程序 中 改变 字体 可 能 会 导致 布局 混乱 。 

e 如 果 改 变 已 有 窗口 布局 ， 就 必须 重新 编写 所 有 部 件 的 布局 。 

所 以 布局 类 方式 是 常用 的 布局 方式 。 布 局 类 是 用 于 控制 以 及 调整 主 窗口 的 Qt 类 ， 在 布 
局 类 中 注册 相应 的 组 件 ， 并 且 不 指定 注册 组 件 的 绝对 位 置 ， 当 用 户 调整 父 窗口 尺寸 时 ， 布 局 
类 会 根据 需要 重新 调整 /移动 子 部 件 。 

常用 的 布局 类 有 QBoxLayout, QHBoxLayout, QVBoxLayout, QGridLayout 四 种 ， 均 继 
承 自 抽象 基 类 QLayout. QBoxLayout 可 水 平 /垂直 排列 ;QHBoxLayout、QVBoxLayonut、 
QGridLayout 是 水 平 、 垂 直 、 表 格 排列 布局 。 其 中 QHBoxLayout. QVBoxLayout 继承 于 
OBoxLayout. 


创建 完 组 从 


的 子 对 象 。 每 个 QLayout 对 象 必须 扩 


创建 布局 时 通过 类 定义 传递 一 个 父 组 伯 
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或 者 布局 和 


F 后 ， 需 要 通过 addWidget0 把 它们 添加 到 布局 实例 中 。 
上 有 父 对 象 ， 可 以 是 QWidget， 也 可 以 是 QLayout。 可 在 


E r4 


HA > 


H zi 


添加 后 ， 成 为 该 布 


对 象 ， 也 可 通过 调 


用 addLayout() RA ži 
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将 一 个 布局 添加 为 另外 一 个 布局 的 子 布局 。 

下 面 是 QBoxLayout、QHBoxLayout、QVBoxLayonut 的 使 用 方法 。 H2S Example 的 实 
例 为 QBoxLayout 父 组 件 ，QBoxLayout 初始 化 时 指定 了 子 布局 的 排列 方式 ， 即 QtGui. 
QBoxLayout.LeftToRight〈 从 左 到 右 )。 代 码 文 件 为 ch11-6.py， 图 11-8 是 运行 结果 。 


imi 


import sys 
from PyQt4 import QtGui . 
3 Dialog Lo 
class Example(QtGui.QDialog): [P] checkboxt 
[C] elieckbua2 
Cancel 
def init (self): 回 eheckbox3 
super(Example, self). init O checkbox4 
self.initUI() 图 11-8 PyQt 的 布局 管理 实例 
def initUI(self): 


okButton = QtGui.QPushButton("OK") 

cancelButton = QtGui.QPushButton("Cancel") 

# 

QBoxLayout.LeftToRightHorizontal from left to right. 
QBoxLayout.RightToLeftHorizontal from right to left. 
QBoxLayout.TopToBottom Vertical from top to bottom. 
QBoxLayout.BottomToTop Vertical from bottom to top. 


m 


mainbox=QtGui.QBoxLayout(QtGui.QBoxLayout.LeftToRight,self) 


hbox = QtGui.QHBoxLayout() 
hbox.addStretch(1) 
hbox.addWidget(okButton) 
hbox.addWidget(cancelButton) 


checkbox1-QtGui.QCheckBox("checkbox1") 
checkbox2-QtGui.QCheckBox("checkbox2") 
checkbox3-QtGui.QCheckBox("checkbox3") 
checkbox4-QtGui.QCheckBox("checkbox4") 
vbox = QtGui.QV BoxLayout() 


vbox.addWidget(checkbox1) 
vbox.addWidget(checkbox2) 
vbox.addWidget(checkbox3) 
vbox.addWidget(checkbox4) 


mainbox.addLayout(vbox ) 
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mainbox.addLayout(hbox ) 
self.setLayout(mainbox) 
self.setGeometry(100, 100, 100, 50) 
self.setWindowTitle('Dialog") 
self.show() 
def main(): 
app = QtGui.QA pplication(sys.argv) 


ex = Example() 


sys.exit(app.exec ()) 
if name --' main ' 


main() 


图 11-8 中 的 所 有 checkbox 是 按 垂 直方 向 摆 放 的 〈 即 QVBoxLayout 的 摆 放 方式 “OK” 和 


“Cancel” 按 钮 是 以 水 平方 同 摆 放 的 “QHBoxLayout 的 摆 放 方式 )， 而 QtGridLayout 是 一 


二 维 方 式 组 织 H PyQt 组 件 的 布局 方式 。 


种 按照 


将 上 面 例子 中 的 QVBoxLayout 的 实例 vbox 改 成 QGridLayoutO0。 并 修改 addWidget() FR 


数 ， 指 定 组 件 位 置 ， 代 码 如 下 。 运 行 结果 如 图 11-9 所 示 。 


vbox = QtGui.QGridLayout() 


| E) Dialog 


e| 5j 


vbox.addWidget(checkbox1,0,0) 
vbox.addWidget(checkbox2,0,1) 

checkbox3 checkbox4 
vbox.addWidget(checkbox3,1,0) in 


E checkbox1 E] checkbox? 
š => 
[7] 


vbox.addWidget(checkbox4, 1,1) 


1122 PyQt 的 事件 


图 11-9  QGridLayout 实例 


PyQt 的 组 件 使 用 方法 与 Tkinter 具有 一 定 的 相似 性 。Tkinter 中 对 于 用 户 的 输入 响应 采用 
JE command (ENA) 的 方式 ，PyQt 提供 了 几 种 事件 处 理 机 制 : 高 级 信号 〈signals) RIS 


(slots) 机 制 以 及 低级 事件 句柄 。 


低级 事件 句柄 主要 用 于 自 定 义 组 件 。 信 和 号 与 槽 方式 较为 常用 ， 这 种 方式 提 作 


H 


对 象 之 间 的 通信 机 制 。 其 中 信号 会 在 茶 个 特定 情况 或 动作 下 被 触发 ， 模 
号 的 函数 。 


例如 ， 要 将 一 个 窗口 中 的 变化 情况 通知 给 另 一 个 窗口 ， 则 一 个 窗口 


是 用 了 


上 了 两 个 Qt 


接收 并 处 理 信 


发 送信 号 ， 另 一 个 窗 


口 的 槽 接收 此 信号 并 进行 相应 的 操作 ， 即 可 实现 两 个 窗口 之 间 的 通信 。 


应 信号 ， 完 成 相应 的 处 理 。 
对 应 代码 如 下 (ch11-7.py)。 


# encoding:utf-8 
# Vusr/bin/python 
from PyQt4.QtGui import * 
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设 定 的 信号 和 槽 ， 当 某 一 特定 事件 发 生 时 ， 一 个 信号 被 发 射 ， 与 信号 关联 的 槽 则 会 接收 # 


啊 


from | PyQt4.QtCore 
import sys 
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import * 


App-QApplication(sys.argv) 
b=QPushButton(u" 按 钮 ,点 击 退 出 ") 


b.show() 


App.connect(b,SIGNAL('clicked()),App,SLOT("quit()")) 


App.exec () 


当 按 钮 被 按 下 时 触发 clicked 信号 ， 与 之 连接 的 = 


QApplication 对 象 的 quit( 


) 响 应 按钮 单 击 信号 ， 执 行 退 出 动 


作 。 运行 界面 如 图 11-10 所 示 。 图 11-10 PyQt WR s 5 Rs 


11.2.3 PyQt 的 ToDo 实例 


下 面 采 用 PyQt 设计 一 


个 小 型 的 ToDo List 程序 (ch1l1-8.py)。 前 面 的 两 个 例子 均 是 直接 


将 控件 作为 顶层 窗 体 ， 但 多 数 情况 下 使 用 继承 QDialog、QMainWindows、QWidget 的 方式 。 
QDialog、QMainWindow 甚至 所 有 的 PyQt 的 控件 均 继承 于 QWidget。 本 例 采 用 了 继承 
QWidget， 并 通过 ”init 调用 super(Application, self) 进 行 父 类 初始 化 。 


class Application(QtGui.QWidget): 
def init (self): 


super(Appli 


cation, self). init O 


fr init 中 调用 initDb0 与 initUIO。 其 中 initDb 进行 数据 库 初始 化 ， 该 例 使 用 了 SQLite 数 


JE, Æ initDb 中 创建 了 ToDo X. 
的 初始 化 ， 其 中 下 列 代 码 是 进行 窗 体 设置 。setGeometry0 定 位 窗 体 在 屏幕 


= 


initUI 是 对 U 
上 的 位 置 并 指定 窗 体 尺 寸 。 


前 两 个 参数 是 窗 体 的 X/Y 位 置 ， 后 两 个 分 别 是 宽度 和 高 度 信息 。 


self.setGeometry(300,300, 300, 300) 
self.setWindowTitle(PyQt ToDo List"); 


self.show() 


在 initUI 中 实现 对 QComboBox. QLineEdit, QPushButton. QListWidget 控件 的 初始 


化 以 及 信和 号 与 槽 配置 。 下 面 是 添加 按钮 的 使 用 。setToolTip 中 包含 完整 的 Html， 可 增强 显示 


效果 。 在 该 Html FA] 


接 设 置 了 字体 、 字 体 颜色 、 上 标 、 下 画 线 属 性 ， 也 可 通过 


QToolTip.setFont 设置 字体 属性 。 效 果 如 图 11-11 所 示 。addRow 是 bt 按钮 的 clicked 信和 号 的 


Fš, Æ addRow 函数 中 添 力 


self.bt = QtGui.QPushButton(self) 


self.bt.setText(u" 添 加 
self.bt.setToolTip(u""" 


新 的 记录 。 
inem 
新 记录 ") PE 


图 11-11 QToolTip 例子 


<html><head/><body><p> 


«span style=" font-weight:600; font-style:italic; text-decoration: underline;"> 添 </span> 加 
p 8 y p 


II 


«span style-" vertical 


</p></body> 


-align:super;">+</span><span style-" color:#aa0000;">Add</span> 
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</html>""") 
self.bt.clicked.connect(self.addRow) 


控件 布局 的 对 应 代码 如 下 : 


self.gbox = QtGui.QGridLayout(self) 
self.gbox.addWidget(self.cb) 
self.gbox.addWidget(self.bt) 
self.gbox.addWidget(self.btDel) 
self.gbox.addWidget(self.ib) 
self.gbox.addWidget(self.results) 
self.setLayout(self.gbox) 


设置 完 ， 启 动 代 码 如 下 : 


def main(): 
app = QtGui.QA pplication(sys.argv) 
ex = Application() 
sys.exit(app.exec ()) 

if name --' main 


'. 


main() 
完整 代码 如 下 : 


#!/usr/bin/env python 
#-*- coding: utf-8 -*- 
import sys 

from PyQt4 import QtGui 
from string import join 


import sglite3 as db 


DAYS = í 
0: wE", 
1: u" 星 期 二 "， 
2: u" 星 期 三 "， 
3:u" 星 期 四 "， 
4: u" 星 期 五 "， 
5: u" 星 期 六 "， 
6: u" 星 期 天 "， 

} 


class Application(QtGui.QWidget): 

def init (self): 
super(Application, self). init () 
self.dbName - 'todolist.db' 
self.initDb() 
self.initUI() 

def initDb(self): 
cx = db.connect(self.dbName) 


cu=cx.cursor() 
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cu.execute("""CREATE TABLE if not exists todo (day INTEGER, h INTEGER, 
m INTEGER, note VARCHAR(100), UNIQUE(day, h, m))""") 
cx.close() 
def findDay(self, day): 
con = db.connect(self.dbName) 
cur = con.cursor() 
cur.execute(" SELECT h,m,note FROM todo WHERE day=%d" % day) 
data — cur.fetchall() 
while self.results.count() > 0: 
it = self.results.takeItem(0) 
self.results.removeltemWidget(it) 
for i in data: 
h = str(i[0]) 
m = str(i[1]) 
note = unicode(i[2]) 
if int(i[0]) < 10: 
h ='0' + str(i[0]) 
if int(i[1]) < 10: 
m= '0' + str([1]) 
self.results.addltem(h + ':' +m +' ' + note) 
self.results.show() 
def getDay(self): 
self.findDay(self.cb.currentIndex()) 
def delRow(self): 
if len(self.results.selectedItems()): 
it — self.results.selectedItems()[0] 
i = self£.results.row(it) 
it = self.results.takeltem(i) 
text = unicode(it.text()) 
hm = text.split(' )[0] 
d = int(self.cb.currentIndex()) 
n = join(unicode(text).split( )[1:]) 
h = int(hm.split(:)[0]) 
m= int(hm.split(':)[1]) 
print d, h, m, n 
self.deleteRow(d, h, m, n) 
self.results.removeltemWidget(it) 
def addRow(self): 
if not self.ib.isHidden(): 
self.getInp() 
self.ib.setHidden(True) 
return 
self.ib.setHidden(False) 
self.ib.setText('Enter task here in "h:m some task" format") 
def getInp(self): 
text — unicode(self.ib.text()) 
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hm = text.split(' )[0] 

d= int(self.cb.currentIndex()) 

n = join(unicode(text).split( )[1:]) 
h = int(hm.split(*:)[0]) 

m = int(hm.split(:)[1]) 

print d, h, m, n 

self.insertRow(d, h, m, n) 
self.findDay(self.cb.currentIndex()) 
self.ib.setHidden(True) 


def deleteRow(self, day, h, m, note): 


con = db.connect(self.dbName) 


cur = con.cursor() 


cur.execute("DELETE FROM todo WHERE \ 
day=%d AND h=%d \ 
AND m=%d AND note-'9os;" À 
% (day,h,m,note)) 


con.commit() 


def insertRow(self, d, h, m, n): 


con = db.connect(self.dbName) 

cur = con.cursor() 

cur.execute("INSERT into todo(day,h,m,note) VALUES \ 
(%d, %d, %d, '%s');" % (d, h, m, n)) 


con.commit() 


def initUI(self): 


self.cb = QtGui.QComboBox(self) 
for kv in DAYS.items(): 
self.cb.insertltem(k, | (v)) 
self.cb.currentIndexChanged.connect(self.getDay) 
self.bt = QtGui.QPushButton(self) 
self.bt.setText(u" KJH") 
self.bt.setToolTip("Add") 
self.bt.clicked.connect(self.addRow) 
sel£.btDel = QtGui.QPushButton(self) 
self.btDel.setText(u" JKR") 
self.btDel.setToolTip("Delete") 
self.btDel.clicked.connect(self.delRow) 
selfib = QtGui.QLineEdit(self) 
self.ib.setHidden(True) 
self.ib.returnPressed.connect(self.getInp) 
self.results = QtGui.QListWidget(self) 
self.gbox = QtGui.QGridLayout(self) 
self.gbox.addWidget(self.cb) 
self.gbox.addWidget(self.bt) 
self.gbox.addWidget(self.btDel) 
self.gbox.addWidget(self.ib) 
self.gbox.addWidget(self.results) 
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self.setLayout(self.gbox) 

self.setGeometry(300,300, 300, 300) 

self.setWindowTitle('PyQt ToDo List"); 


self.show() 3] PyQt ToDo List laks 

def main(): 旺 期 二 
app = QtGui.QApplication(sys.argv) 添加 新 记录 
ex = Application() B z 
sys.exit(app.exec_()) n 

if name =='_ main * 
main() 

上 例 展示 了 PyQt 的 GUI 应 用 ， 运 行 效果 见 图 11-12. 
本 例 没有 使 用 PyQt 自 带 的 数据 库 模块 ， 读 者 可 根据 需要 先 


用 此 模块 。 


D 


11-12. PyQt 的 ToDo List 程序 


11.3 ”小结 


本 章 以 对 比 的 方式 介绍 了 Tkinter 与 PyQt 的 使 用 ， 主 要 有 组 件 定义 、 组 件 布局 
理 、 组 件 事件 响应 。 对 于 二 者 甚至 其 他 的 GUI 框架 的 选用 ， 可 根据 程序 复杂 度 、 平 
库 


AX 
特点 、 其 他 扩展 功能 支持 (例如 PyQt 已 经 不 仅 是 GUI 框架 ， 还 包含 其 他 丰富 库 
持 )、 版 权 要 求 等 进行 。 

Tkinter, PyQt 均 有 相应 可 视 化 设计 工具 。Tkinter 的 工具 有 pygubu Chttps;//github.com/ 
alejandroautalan/pygubu ) 和 Tkinter-designer (https://github.com/cdhigh/tkinter-designer) . PyQt 
可 视 化 设计 工具 是 Qt Designer. H] Qt Designer 设计 出 的 界面 ， 可 通过 Pyuic4 将 UI 转换 成 
Python 代码 或 用 uic 模块 的 loadUi 函数 进行 动态 加 载 。Eric 已 经 将 Qt Designer KAHF, 
方便 用 户 用 PyQt 进行 开发 。 
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Zia fas 


巧 妇 难为 无 米 之 炊 ， 大 数据 处 理 首先 要 解决 数据 的 获取 问题 。 数 据 既 可 来 源 于 互联 网 ， 
也 可 来 源 于 物 联 网 的 传感器 ， 或 者 来 自 专业 的 调研 公司 。 目 前 Python 的 pyserial 5 pyvisa 


(其 他 的 软件 可 从 pypi 上 查找 ) 支持 RS-232、 
网 ) 的 数据 采集 。 


GPIB, USB 接口 ， 可 用 于 硬件 设备 ( 物 联 


各 数据 源 提供 的 数据 格式 是 多 种 多 样 的 ， 常 见 的 有 文本 格式 、CSV 格式 、Excel 文件 以 


及 JSON、XML、HTML 还 有 多 种 数据 库 文件 


水 应 用 、GPU、 并 行 、 效 率 工 具 等 方面 的 Pytho 


常用 的 数据 格式 ， 然 后 介绍 HDFS 的 数据 存储 ， 


12.1 JSON 


12.1.1 JSON 格式 定义 


其 至 PDF 文件 和 HDF 文件 。 
http:/www.xmind.netm/WvfC/ 给 出 了 Python 处 理 大 数据 的 “十 八 般 武器 ” 在 该 思维 导 
图 (附录 中 引用 了 该 图 ) 中 给 出 了 数据 平台 集成 、 数 据 可 视 化 、 数 据 格式 、MapReduce、 胶 


n 工具 ， 其 中 NumPy、SciPy、pandas 是 大 数 


据 的 基础 。 前 面 章 节 已 经 介绍 了 NumPy、SciPy。 本 章 将 首先 介绍 JSON. XML 等 互联 网 中 


最 后 介绍 pandas。 


JSON (JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ， 相 对 于 XML 而 言 更 


小 巧 ， 同 时 适合 机 器 解析 和 生成 。JSON 基于 JavaScript 语言 ， 是 ECMAScript 的 一 个 子 集 。 


JSON 采用 完全 独立 于 语言 的 文本 格式 ， 但 许多 地 方 与 C 语言 相似 。 这 些 特性 使 JSON 成 为 


理想 的 数据 交换 语言 。 


JSON 的 规范 标签 形式 使 得 JSON 具有 极 强 的 可 读 性 。 目 前 在 Ajax 领域 ，JSON 得 到 了 
大 量 应 用 。 国 内 很 多 网 站 的 数据 传输 均 采 用 JSON É. Python 从 2.6 开始 支持 JSON, IHH 
果 使 用 低 版 本 的 Python， 对 应 的 JSON 软件 包 是 simplejson。Python 的 JSON 模块 序列 化 与 
反 序 列 化 的 过 程 分 别 是 encoding (把 一 个 Python 对 象 编码 转换 成 JSON EB) 和 
decoding (把 JSON 格式 字符 串 解 码 转换 成 Python 对 象 )。 

JSON 数据 就 是 一 串 字 符 串 ， 只 不 过 元 素 会 使 用 特定 的 符号 标注 。 具 体形 式 如 下 : 

€ HZ (object): 一 个 对 和 象 以 “{” 开 始 ， 以 “}” 结 束 。 一 个 对 象 包含 一 系列 非 排 序 的 名 

称 / 值 对 ， 每 个 名 称 / 值 对 之 间 使 用 “,” 分 区 。 例 如 {"name":"Michael","age":18 }。 


e 名 称 / 值 (collection): 名 称 和 值 之 间 使 月 


“: ” 隔 开 ， 一 般 的 形式 是 : {name:value}。 


一 个 名 称 是 一 个 字符 串 ; 一 个 值 可 以 是 一 个 字符 串 ， 一 个 数值 ， 一 个 对 象 ， 一 个 布尔 
值 ， 一 个 有 序列 表 ， 或 者 一 个 null 值 。 例 如 ; {"name":" Michael "1. 
e 值 的 有 序列 表 Cray): 一 个 或 者 多 个 值 用 “,” 分 隔 后 ， 使 用 “[ 交 “]” 括 起 来 就 形 


成 了 这 样 的 列表 。 例 如 : {"color": ["red", "green", "blue"]}， 其 中 的 ["red",，"green", 
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"blue"] 即 表示 列表 。 

e 字符 串 : 以 双 引 号 括 起 来 的 一 串 字符 。 

e 数值 : 一 系列 0~9 的 数字 组 合 ， 可 以 为 负数 或 者 小 数 。 还 可 以 用 “e” 或 者 “E” 表 
示 为 指数 形式 。 

e 布尔 值 ， 表示 为 true 或 者 false, 


12.1.2 simplejson Jf 


包含 JSON 的 Python 包 主 要 有 Python 标准 库 、PYSON Yaj-Py. ultrajson 、 
metamagic.json。Python 数据 与 JSON 主要 操作 有 编码 (encoding， 对 应 的 函数 主要 是 dump 
或 者 dumps) 和 解码 (decoding， 对 应 的 函数 为 load 或 者 loads). Python 数据 类 型 与 JSON 
数据 对 应 关系 见 表 12-1。 


表 12-1 Python 数据 与 Json 数据 对 应 关系 


Python--JSONZWf] (dump) JSON->Python 解 码 (load) 

dict object object dict 

list,tuple array array list 
str,unicode string string unicode (Python3 为 str) 
int,long,float number number(int) int, long (Python3 为 int) 

number(real) float 

True true true True 

False false false False 

None null null None 

simplejson 是 简单 、 快 速 、 可 扩展 的 JSON 编 /解码 器 ， 以 纯 Python 代码 编写 ， 但 包含 了 


可 选 的 c 3 mH THE OS SORS. 

simplejson 需要 使 用 pip EK easy. install 进行 安装 。 

dumps 函数 可 将 Python 对 象 编码 成 JION， 实 际 返 回 的 是 字符 串 。loads 函数 可 将 JSON 
解码 〈 输 入 的 是 字符 串 数 据 ) 成 Python 对 象 。 下 面 的 代码 将 元 组 转换 成 ION， 然 后 通过 
loads 转换 成 列表 〈 见 表 12-1 说 明 )。 


>>> from pprint import pprint 

>>> import simplejson as json 

>>> tupl-'red'/green'/'bluet75£H 

>>> print (json.dumps(tupl)) 

["red", "green", "blue"] 

>>> print (type(json.loads(json.dumps(tup1))))4/À JSON 恢复 数据 
«type 'list'> 


列表 数据 与 JSON 相互 转换 : 


>>> listl=[11,22,33 #7] Æ 

>>> print (type(json.dumps(list1))) 

<type 'str'> 

>>> print (type(json.loads(json.dumps(list1)))) 


yx 
H 


为 列表 
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«type 'list'> 
Python 的 字符 串 数据 与 JSON 数据 转换 : 


>>> stringl = Python and JSON' # 字 符 串 
>>> print(json.dumps(string1)) 

"Python and JSON" 

>>> 


布尔 型 数据 与 JSON 转换 : 


>>> x= True; # 布 尔 型 数据 
>>> print(json.dumps(x)) 


true 


整 型 数据 、 浮 点 型 数据 与 JSON 转换 : 


>>> x = -456; 

>>> y = -1.406; 

>>> z=2.12e-10 

>>> print(json.dumps(x)) 
-456 

>>> print(json.dumps(y)) 
-1.406 

>>> print(json.dumps(z)) 
2.12e-10 


上 述 浮 点 型 数据 与 JSON 转换 过 程 无 任何 异常 。 因 为 该 过 程 相 当 于 float(num str). WR 
处 理 如 下 数据 ， 返 回 结果 与 输入 数据 就 不 同 了 : 


>>> a=1617161771.7650001# 浮 点 型 数据 的 有 效 精度 
>>> print( json.dumps(a)) 

1617161771.765 

>>> print (json.loads(json.dumps(a))) 

1617161771.77 


为 了 处 理 float 型 数据 ， 可 使 用 Decimal: 


>>> from decimal import Decimal 

>>> b-Decimal(1617161771.7650001") 
>>> print( json.dumps(b)) 
1617161771.7650001 


如 果 采 用 下 面 的 解析 方式 ， 结 果 也 不 是 我 们 想 要 的 结果 ; 


>>> print (json.loads(json.dumps(b))) 
1617161771.77 


需要 采用 如 下 形式 : 
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>>> print (json.loads(json.dumps(b),use decimal-True)) 
1617161771.7650001 


如 果 增 加 了 use decimal-True X, loads 返回 的 数据 类 型 为 Decimal, 如 果 不 用 该 参数 ， 
将 返回 float。 使 用 Decimal 方式 对 浮 点 类 型 的 数据 进行 处 理 是 严谨 的 。 


>>> k= (json.loads("1617161771.7650001",use decimal-True)) 

# 等 同 k=  json.loads("1617161771.7650001" parse float-decimal.Decimal) 
>>> print(k) 

1617161771.7650001 

>>> g= (json.loads("1617161771.7650001")) 

>>> print(g) 

1617161771.77 

>>> print(type(k),type(g)) 

(<class 'decimal.Decimal'7, «type 'float'>) 


下 面 是 字典 形式 的 数据 解释 ，dumps 函数 支持 对 字典 排序 ， 例 如 ; 


>>> student = ("101":("class": V', "Name":'Rohit', "Roll no":7}, 
"102": ("class":' V', "Name":'David', "Roll no":8}, 

¿ "103": ("class":' V', "Name":'Samiya', "Roll no":12}} 

>>> print(json.dumps(student, sort keys-True)) 

£101": ("Name": "Rohit", "Roll no": 7, "class": "V"j, "102": ("Name": "David", "Roll no": 8, "class": 
"V". "103": "Name": "Samiya", "Roll no": 12, "class": "V"}} 

>>> pprint(json.dumps(student )) 

'1"102": ("class": "V", "Roll no": 8, "Name": "David", "103": í"class": "V", "Roll no": 12, "Name": 
"Samiya"), "101": ("class": "V", "Roll no": 7, "Name": "Rohit"j j' 

>>> pprint(student) 

{'101': ('Name* 'Rohit', 'Roll. no': 7, 'class': 'V'j, 

'102*: ('Name'": 'David', Roll no': 8, 'class': 'V'}, 
'103*: ('Name'": 'Samiya', Roll no*: 12, 'class': 'V'}} 

>> 

>>> son data —'("103": ("class": "V", "Name": "Samiya", "Roll n": 12}, "102": {"class": "V", "Name": 
"David", "Roll no": 8j, "101": ("class": "V", "Name": "Rohit", "Roll no": 713; 

>>> print(json.loads(json data)) 

(102': ('class': 'V', Roll no': 8, Name': ' David} '103': ('Roll n': 12, 'class': 'V', Name": 'Samiya'), '101': 
{'class': 'V', Roll no* 7, 'Name": 'Rohit'] j 

>> 

>>> obj = ([1,2,3],123,123.123,'abc", {key1':(1,2,3), key2':(4,5,6)}) 

>>> encodedjson = json.dumps(obj,indent-True) 


T 


>>> print repr(obj) 
([1 2, 3], 123, 123.123, 'abc', ('key2': (4, 5, 6), 'key1': (1,2, 3)}) 
>>> print encodedjson 
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3 
], 
123, 
123.123, 


" 


{ 
"key2": [ 


" 


abc", 


>>> decodejson = json.loads(encodedjson) 


>>> print type(decodejson) 
«type list 


>>> print encodedjson 


], 
123, 
123.123, 


" 


{ 
"key2": [ 


" 


abc", 


与 dumps/loads 对 应 的 是 dump/load, 
… from StringIO import StringIO 
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F 数 据 。 例 如 : 
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>>> 
>>> sio=StringIO () 
>>> json.dump(list1,sio) 


>>> print sio.getvalue() 
[11, 22, 33] 
>>> print(json.dumps( ('4': 5, '6': 7), sort keys-True, indent-4 * ' ')) 


{ 


} 


"4"; 5, 
"6": 7 


下 面 的 代码 (本 节 的 代码 在 jsontest.py P) 可 将 obj 的 元 组 数据 转换 成 JSON 数据 ， 并 


通过 loads 


将 JSON 解码 回 Python 数据 。 可 结合 表 14-1 观察 Python 的 元 组 数据 、 单 引号 的 


字符 串 数据 、 以 及 Python 字符 串 数据 与 Unicode 数据 变化 情况 。 


import simplejson as json 
obj = ([1,2,3],123,123.123,'abc', {'key1':(1,2,3),'key2':(4,5,6)}) 


e 


ncodedjson = json.dumps(obj,indent=True) 


print repr(obj) 


print encodedjson 


decodejson = json.loads(encodedjson) 
print type(decodejson) 
print encodedjson 


运行 结果 如 下 : 


([1 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'keyl': (1, 2, 3)}) 


123, 
123.123, 


" 


{ 

"key2": [ 
4, 
5, 
6 

] 

"key1": [ 
l, 
2, 
3 

] 


abc 


" 
$ 
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j 
] 


«type list 


} 
123, 
123.123, 
"abc", 
{ 

"key2": [ 


12.1.3 通过 JSON 读 取 汇率 


通过 网 络 收集 数据 属于 比较 便捷 的 方式 。 可 通过 Chrome 或 Firefox 的 开发 者 模式 查找 各 
种 JSON 数据 源 。 下 面 讲解 一 个 从 互联 网 获取 JSON 数据 的 实例 。 

http://data.bank.hexun.com/other/sogou/ratejson.ashx 是 一 个 汇率 数据 源 〈 因 为 该 网 址 可 能 
随时 发 生变 化 ， 在 书 中 代码 附加 了 jsondata.txt 文件 ， 里 面包 含 该 数据 源 的 数据 内 容 ， 可 将 实 
例 中 的 urlopen 改 为 相应 文件 操作 方式 )。 该 数据 源 返 回 的 是 JSON 格式 数据 ， 通 过 解释 该 数 
据 源 可 获取 汇率 信息 。 

该 数据 源 的 输出 数据 形 如 RateJson( ("huilv":[ ("name":" A E (CNY) ","value":"1"},{"na 
me":" 4A] EE R(CLP)","value":"0.0101"}],"time":"2015-04-18 20:28") (该 数据 有 所 删 减 ， 详 
细 数 据 见 本 书 代码 ， 或 者 直接 从 网 址 下 载 )。 

通过 分 析 该 数据 源 的 数据 ， 发 现 它 不 是 标准 的 JSON 数据 ， 前 面 多 了 “RateJson({” 的 
内 容 ， 后 续 内 容 可 作为 标准 的 JSON 数据 。 所 以 要 先 通 过 jsondata[jsondata.index(" f"): 
len(jsondata)-1] 将 数据 转换 为 标准 的 JSON 数据 ， 然 后 通过 loads 将 JSON 数据 转 为 Python 

下 面 的 代码 是 jsontest.py 的 核心 代码 。 完 整 的 代码 可 以 同时 运行 在 Python 2 £l Python 3 
。 如 果 原 网 址 失效 ， 可 参考 第 5 章 修 改 代码 读 取 jsondata txt 文件 。 
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urlstr='http://data.bank.hexun.com/other/sogou/ratejson.ashx' 
headers =  ('User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 


Firefox/23.0' 


req=  urllib2.Request(urlstr, headers = headers ) 
fp = urllib2.urlopen(req) 
jsondata-fp.read() 


dd-json.loads(jsondata[jsondata.index(" ("):len(jsondata)-1] ) 
#print dd['huilv'] 
print ("96s If] TL 3S suatu de P HHBHHHHHHHHHHHHHHHHHEND Ve dd['time!])) 
for i in dd['huilv']: 
print("%s 汇率 是 :%s" %( i['name'],i['value'] )) 


运行 结果 《〈 部 分 ) 如 下 : 


2015-10-26 22:22 的 汇率 情况 表 


THHHHHHHHHHHHHHHHHHHHHE 


人 民 币 (CNY) 汇 率 是 :1 

阿尔 及 利 亚 第 纳 尔 (NGN) 汇 率 是 :0.0597 
阿根廷 比索 (ARS) 汇 率 是 :0.6689 
阿联酋 迪 拉 姆 (AED) 汇 率 是 :1.7295 
阿曼 里 亚 尔 (OMR) 汇 率 是 :16.5060 
埃及 镑 (EGP) 汇 率 是 :0.7910 
爱尔兰 镑 (IEP) 汇 率 是 :4.5326 
奥地利 先 令 (ATS) 汇 率 是 :0.5095 
澳大利亚 元 (AUD) 汇 率 是 :4.6085 
澳门 元 (MOP) 汇 率 是 :0.7962 
巴基斯坦 卢比 (PKR) 汇 率 是 :0.0608 
巴拉圭 瓜 拉 尼 (PYG) 汇 率 是 :0.0011 


12.2 XML 


12.2.1 XML 基本 定义 


XML 即 可 扩展 标记 语言 ， 它 可 以 用 来 标记 数据 、 定 义 数 据 类 型 ， 是 一 种 允许 用 户 对 


己 的 标记 语言 进行 定义 的 源 语 言 。XML 5 HTML 目的 不 同 ，XML 用 于 传输 数据 而 HTML 


HTE 


mds. XML 的 标签 均 是 自 定义 的 。RSS 是 常见 的 XML 实现 。 


XML 文档 包含 由 起 始 和 结束 标签 Cag) 分 隔 的 一 个 或 多 个 元 素 〈element)。 文 档 必 须 包 


含 根 元 素 ， 该 元 素 是 所 有 其 他 元 素 的 父 元 素 ， 一 个 XML 文档 中 只 有 一 个 根 元 素 。XML 文档 
的 元 素 形 成 了 一 棵 文档 树 。 这 棵 树 从 根部 开始 ， 并 扩展 到 树 的 最 底 端 。 所 有 元 素 均 可 拥有 子 


JUR» 


Juj S aR. 2538 PG E, JarPEn[ pl ar ES, EtA- (name-value) 
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性 名 不 能 重复 ， 属 性 值 必须 用 引号 包围 起 


Pun 


对 ， 属 性 ! 


空格 分 隔 ， 列 举 在 元 素 的 起 始 标 签 中 ， 拓 


来 ， 单 引号 、 双 引号 均 可 。 元 素 也 有 文本 内 容 。 下 面 是 一 个 XML 文件 内 容 。 


<?xml version='1.0' encoding='UTF-8'?> 
«root rootattr1—" 123" rootattr2="456"> 


root 文本 内 容 


«childl» 
hello childl 文本 内 容 
</child1> 
<child2/> 
</root> 


Python 一 直 注 重 对 XML 数据 的 处 理 ， 从 2.0 版 本 开始 ， 它 就 附带 了 xml.dom.minidom 和 
相关 的 pulldom 以 及 Simple API for XML(SAX) 模块 。 从 2.4 开始 ， 它 附带 了 流行 的 


ElementTree API。 此 外 ， 很 多 第 三 方 库 可 以 提供 更 高 级 别 的 或 更 具有 Python 风格 的 接口 。 


12.2.2 LXML 库 使 用 


LXML 


库 是 对 两 个 优秀 C 语言 XML JE (libxml2 5 libxslt) 的 Python 封装 ， 速 度 很 


快 ， 是 XML 的 完整 实现 。LXML 集成 了 多 款 XML 与 HTML 软件 ， 如 XPath, XSLT, 
Ixml.objectify. 、lxml.html 、lxmlcssselect、Beautiful Soup. 、htmlSlib ， 从 而 可 用 于 XML 与 
HTML 场合 。 


LXML 


已 经 包含 在 Anaconda 中 ， 无 需 安装 。 


下 面 的 代码 利用 LXML 库 创 建 xml 文件 (代码 在 lxmltest.py 中 )。 


def building xml(): 


root-etree.Element("root" ) 
root.text-u"root 文本 内 容 " 
root.set("rootattr1"," 123") 
root.set("rootattr2","456") 
print root.tag# 输 出 元 素 标 签 
print root.keys(0# 输 出 属性 名 
print root.itemsO# 输 出 属性 
print roottext# 输 出 文本 内 容 
child1-etree.SubElement(root,"child1") 
child2-etree.SubElement(root,"child2") 
childl.text-u" hello child! 文本 内 容 " 


print etree.tostring(root,pretty_print=True) 


tree = etree.ElementTree(root) 
tree.write(" XMLFile.xml", encoding-'utf-8'method-"xml",xml declaration-True) 


return 


生成 的 XMLFile.xml Vj Zl F: 


<?xml version- 1.0' encoding='UTF-8'?> 
«root rootattrl-"123" rootattr2-"456"-root 文本 内 容 <childl> hello childl X À Pj 7 
</child1><child2/></root> 
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12.2.3 ”通过 XML 读 取 新 浪 和 人 民 网 的 RSS 


LXML 的 parse0 用 于 解析 文件 以 及 类 文件 对 象 ， 
件 对 象 、 带 有 返回 字 节 字符 串 的 .read(byte_count) 方 法 的 类 文件 对 象 、 文 件 名 字符 串 以 及 


HTTP 或 FTP 地 址 字符 串 。 例 如 : 


parse 输入 一 个 文 伯 
果 需 要 HTTP iA ul 


参数 可 以 是 已 经 以 二 进 制 形式 打开 的 文 


t=etree.parse('http://rss.sina.com.cn/news/marquee/ddt.xml') 


some file like object = BytesIO("«root»data«/root^") 
tree — etree.parse(some file like object) 


T 


文档 3 


FEE URL 的 速度 通常 较 传递 一 个 打开 的 文件 或 者 文件 对 象 快 。 但 如 
， 则 需要 使 用 URL 认证 库 ， 例 如 urllib2 或 者 request. parse 方法 读 取 整个 
在 内 存 中 构建 一 个 树 ， 所 以 在 处 理 数 据 较 大 的 情况 下 ， 推 荐 使 用 iterparse, BIDXETUSE 


析 。 下 面 的 代码 通过 iterparse 分 析 新 浪 和 人 民 网 的 RSS (Rss 是 站 点 之 间 共 享 内 容 的 一 种 简 
易 方 式 ， 以 XML 形式 提供 数据 ): 


对 于 feed 数据 ， 也 可 采 


def parseXML(xmlFile): 
f= urlopen(xmlFile) 
xml = f.read() 
tree = etree.parse(StringIO(xml)) 
context = etree.iterparse(StringIO(xml)) 
for action, elem in context: 
if elem.tag=='link': 
if not elem.text: 
text = "None" 
else: 
text — elem.text 
print elem.tag + " = " + text 


if name --" main " 


parseXML("http://rss.sina.com.cn/news/marquee/ddt.xml") 


parseXML("'http://www.people.com.cn/rss/politics.xml") 


H feedparser 库 进 行 解析 。feedparser 是 一 个 专业 的 feed 解析 


上 器， 兼容 性 好 ， 使 用 简单 ， 可 用 来 解析 各 种 feeds 数据 ， 包 括 Atom. RDF. RSS 和 CDF 


feed 格式 。 
123 HDF5 
123.1 HDFS 格式 定义 


目前 常用 的 图 像 文 件 格式 (如 GIF. JPG. PCX. 


不 能 存放 除 影 像 信息 外 的 其 他 有 用 数据 ， 如 遥感 影像 


而 且 用 不 同 格式 存储 影像 数据 使 得 数据 读 取 、 传 输 、 


标准 格式 以 解决 上 述 问 题 。HDF 文件 格式 应 运 而 生 ， 


TIFF 等 ) 共同 的 缺点 是 结构 太 简 单 
的 坐标 值 、 参 数 等 都 无 法 在 其 中 保存 ， 
共享 变 得 复杂 。 因 此 ， 有 必要 建立 一 种 


它 可 以 表示 科学 数据 存储 和 发 布 的 许多 
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必要 条 件 。 目 前 应 用 最 广泛 的 版 本 是 HDF5。 


HDF5 文件 包含 7 


数据 集 (dataset 
据 ，metadata ) 。 
群 组 和 数据 集 都 


群 组 〈group ): 2540] 
) 数据 内 容 ， 可 以 是 多 


而 种 基本 数据 对 象 : 


支持 元 数据 与 属性 。HDF5 属 怕 
供 附加 信息 。 数 据 集 是 数据 元 素 的 多 


文件 夹 ， 可 以 包含 多 个 数据 集 或 下 级 群 组 。 
二 数组 ， 也 可 以 是 更 复杂 的 数据 类 型 〈 元 数 


型 ， 能 存放 在 磁盘 里 ， 作 为 


有 两 种 数据 类 型 


5 整 型 、 浮 点 型 、 日 


FE 是 一 个 用 户 自 定义 的 HDF5 接口 ， 提 
E 数 组 ， 同 时 支持 元 数据 。 要 创建 一 个 数据 集 ， 应 用 
程序 必须 指明 数据 集 的 位 置 、 数 据 集 的 名 字 、 数 据 类 型 和 数组 的 数据 大 小 以 及 数据 集 的 创 
建 特性 列表 。 数 据 类 型 定义 了 数据 集 所 包含 的 类 
数据 转换 的 目标 或 来 源 提供 完整 的 数据 类 型 。HDF5 
(atomic) 与 复合 数据 类 型 (compound). 702904528753 (1,57 


一 个 整体 ， 为 
元 数据 类 型 
期 和 时 间 、 字 


符 串 、 比 特 域 和 非 透明 数据 类 型 ， 在 API 的 层面 上 不 能 分 解 成 更 小 的 数据 类 型 单位 。 复 合 


数据 类 型 
多 次 读 ” 的 数据 集 。 


是 一 个 或 者 多 个 元 数据 类 型 的 集合 。 
昌 然 数据 可 以 在 任何 时 候 被 添加 到 文件 9 


作 ， 文 件 就 可 能 会 被 破坏 。 
每 个 HDF5 文件 都 含有 一 个 文件 系统 式 的 节点 结构 ， 能 够 存储 多 个 数据 集 。 与 其 他 简单 
格式 相 比 ，HDF5 支持 多 种 压缩 器 的 即时 压缩 ， 还 能 更 高 效 地 存储 重复 模式 数据 。 对 于 那些 


非常 大 的 无 法 直接 放 入 内 存 的 数据 集 ，HDF5 就 是 不 错 的 选择 ， 


HDF5 不 是 数据 库 ， 


它 最 适合 


BERKU 


因为 它 可 以 


E, MATJILA GB 甚至 上 TB 的 数据 存储 为 HDF5 格式 。 


Me "S 


PF， 但 如 果 同 时 发 生 多 个 写 操 


高 效 地 分 块 读 


Python 可 以 利用 扩展 包 PyTables 或 h5py 来 访问 HDF5 库 ， 它 们 各 自 采 取 了 不 同 的 问题 
了 一 种 直接 而 高 级 的 HDF5 API 访问 接口 ， 而 PyTables 则 抽象 了 HDF5 


解决 方式 。h5py 提供 


的 许多 细 贡 以 提供 多 种 灵活 的 数据 容器 、 


core computation) 的 


#4 PyTables 包 。 


某 些 支持 ， 即 提供 了 


加 列 索引 以 提升 查询 速度 ， 这 与 关系 型 数据 


12.3.2 PyTables 使 用 


Pytables 是 基于 HDF5 库 与 Numpy 的 Python 扩 
优化 以 提高 速度 。PyTables 以 磁盘 存储 结构 形式 处 至 
完全 封装 HDF5， 但 提供 更 方便 的 工具 。 


型 。 固 定 长 度 和 严格 


CPU 时 间 和 IO 的 需求 。 为 了 将 Python 记录 


定义 域 和 属性 。 


PyTables 已 经 包含 在 Anaconda H 


些 月 


展 包 ， 并 使 


表 索 引 、 查 询 功 能 以 及 对 核 外 计算 技术 (out-of- 
于 结构 化 数组 的 高 级 查询 功能 ， 而 且 还 能 添 
库 所 提供 的 表 索 引 功 能 非常 类 似 。 下 面 将 详细 介 


] C 语言 对 一 些 功 能 做 了 


内 存 大 小 的 数据 。PyTables 没有 


PyTables 是 以 表 和 数组 对 象 为 分 层 结构 存储 数 
据 。 其 中 的 表 是 指 记录 的 集合 ， 记 录 值 存储 成 固定 长 度 。 所 有 记录 有 相同 的 
的 数据 类 型 要 求 对 Python 而 言 比较 怪异 ， 但 对 于 大 型 数据 ， 可 降低 对 


本 节 代 但 在 pytablestest.py 文件 中 。 
(1) 声明 列 描述 符 ， 继 承 Description， 下 面 的 代码 定义 了 列 以 及 类 型 。 


class row des(IsDescription): 


B, Joni 


Fh ZO 


结构 和 数据 类 


映射 到 HDFS 的 C 结构 ，PyTables 使 用 专门 类 


第 12 章 大 数据 的 利器 


Date-tb.StringCol(26) 
Nol-tb.IntCol() 
No2-tb.IntCol() 
No3-tb.Float64Col() 
No4-tb.Float64Col() 


(2) 新 建文 件 ， 定 义 了 写 属性 以 及 描述 字符 昌 
h5-tb.open file('tab.h5',w',title-'test pytable") 
创建 表 ， 表 格 名 为 ints flosts, PyTables RF numpy 的 ndarray 对 象 。 


pun 
o 


tab-h5.create table(','ints floats'row des,  title—'ingeters and floats ', expectedrows-rows ) 
ran int = np.random.randint(0, 10000, size-(rows, 2)) 
ran flo = np.random.standard normal((rows, 2)).round(5) 


(3) 获取 表 实 例 的 行 实例 指针 。 


pointer —tab.row 


(4) 使 用 类 似 字典 的 键 值 访问 形式 给 表 的 行 实例 赋值 ， 并 通过 flush 函数 将 表 的 IO 2E 
冲 区 写 入 磁盘。flush 函数 不 仅 保证 了 文件 完整 性 ， 也 释放 了 内 存 资 源 。 


for i in range(rows): 
pointer['Date'] = dt.datetime.now() 
pointer['No1'] = ran int[i, 0] 
pointer['No2'] = ran int[i, 1] 
pointer['No3'] = ran flo[1, 0] 
pointer['No4'] = ran flo[1, 1] 
pointer.append() 

tab.flush() 


(5) 上面 是 直接 在 HDF5 文件 的 root 中 建立 的 表格 。 为 了 管理 方便 ， 可 建立 组 ， 然 后 在 
组 上 建立 表 。 


group = h5.create group("/", hdf5 group','group infromation") 
tabl—h5.create table(group,'grouptable'row des,title-'group table") 
row-tabl.row 
for iin xrange(100): 
row['Date'] = dt.datetime.now() 
row['No1'] = ran int[1, 0] 
row['No2'] = ran int[i, 1] 
row['No3'] = ran flo[i, 0] 
row['No4'] = ran flo[i, 1] 
row.append() 
tab1.flush() 


(6) 除了 组 、 表 ，PyTables 还 有 数组 。 下 面 的 代码 直接 在 PyTables 的 root 中 创建 数组 。 


arr int = h5.create_array('/', 'integers', ran int) 
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arr flo = h5.create array("/, 'floats', ran. flo) 


(7) PyTables 内 的 表 、 数 组 访问 形式 与 Python 的 列表 (元 组 ) 访问 形式 相同 ， 即 通过 
下 标 形式 访问 。 


print tab[:3] 
print h5.root.ints floats[:3] 
print h5.root.hdf5 group.grouptable[2]| Date Hír 5y 列 号 
print h$5.root.integers[1:10] 
fori in h$.rootintegers: 
print i 


PyTables 的 数据 访问 还 支持 类 似 SQL 语句 的 形式 ， 即 where 语句 形式 。 同 时 PyTables 


FF max0、min0、mean0 等 函数 ， 犹 如 使 用 NumPy 的 操作 函数 。 
pandas 中 包含 了 PyTables 软件 。 下 面 介 绍 pandas。 


12.4 pandas 


12.4.1 pandas 介绍 


pandas (Python Data Analysis Library) 是 连接 SciPy 和 NumPy 的 一 种 工具 ， 该 工具 是 
为 了 完成 数据 分 析 任 务 而 创建 的 。pandas 纳入 了 大 量 库 和 一 些 标准 的 数据 模型 ， 能 够 高 效 
地 操作 大 型 数据 集 。pandas 提供 了 一 种 优化 库 功 能 来 读 写 多 种 文件 格式 ， 包 括 CSV 和 高 效 
的 HDF5 格式 。pandas 目前 已 经 成 为 Python 的 数据 处 理 标 准 工具 。 

pandas 的 数据 结构 采用 自动 或 明确 的 数据 对 齐 的 、 带 有 标签 轴 的 形式 。 这 可 以 防止 由 数 
据 不 对 齐 引起 的 常见 错误 ， 并 可 以 处 理 不 同 来 源 的 不 同 索 引 数 据 。 

pandas 处 理 数据 的 基础 是 其 数据 结构 ， 其 中 Series 和 DataFrame 是 两 个 重要 的 数据 结 
KJ. Series 是 一 种 类 似 一 维 数组 的 对 象 ， i 一 组 数据 CNumPy 数据 类 型 ) 和 相应 的 索引 组 
成 。DataFrame 是 表格 型 的 数据 结构 ， 含 有 一 组 有 序 的 列 ， 每 列 可 以 是 不 同 的 值 类 型 〈 数 
组 、 字 符 串 、 布 尔 值 等 )， 类 似 R E ss. pandas 的 数据 结构 更 类 似 Excel 表格 形 
式 ， 数 据 类 型 对 应 NumPy 类 型 数据 ， 但 在 索引 方面 比 NumPy 更 形象 、 灵 活 。 


pandas 包含 在 Anaconda 中 ， 无 需 安装 。 


12.4. pandas 的 Series 


Series 可 通过 NumPy 的 ndarray, Python 的 字典 以 及 常量 数据 创建 。Seies 的 基本 用 
法 如 下 : 


import pandas as pd 


ser=pd.Series(data,index=index) 


下 面 是 用 三 种 常见 方式 创建 Series 对 象 的 示例 : 


>>> s0=pd.Series(np.random.randn(10)) 
>>> s0 
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0 
1 
2 
3 
4 
5 
6 
7 
8 
9 


-1.079665 
1.122284 
0.212255 

-0.537349 

-0.369928 
0.840128 

-0.109323 
0.577860 

-0.809031 

-0.768000 


dtype: float64 
>>> sl -pd.Series(np.random.randn(4),name -"Series data " , index-list' ABCD"))HE ERI | 


>>> 
A 
B 
C 
D 


sl 
0.223138 

-0.128970 
1.142297 
0.285057 
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Name: Series data , dtype: float64 


De 


>>> s2=pd.Series({"A":1,"B":2,"C":3,"D":4}) 


>>> s3=pd.Series(4,index=list(' ABCD") 


>>> S2 

A 1 

B 2 

C 3 

D 4 
dtype: int64 
>>> s3 

A 4 

B 4 

C 4 

D 4 
dtype: int64 


s0 与 s1 是 通过 NumPy 
即 Series 支持 索引 。s2 是 通 


的 ndarray 创建 的 ， 但 sl 显示 了 pandas 的 Series 与 ndarray 的 差异 ， 


TF 


形式 创建 的 ，Series 的 访问 方式 既 可 采用 类 似 Python 的 列表 


(NumPy 的 ndarray) 的 整数 下 标 方式 也 可 以 采用 类 似 字 典 键 的 方式 。 下 面 是 一 些 访问 方式 : 


D» 


s0[0]# 


-1.0796651966959137 


>>> 


sl['A7 


0.22313834785377926 


>>> 


1 
>>> 


4 


s2['A'] 


s3['A'] 
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Series 的 访问 方式 除了 索引 方式 还 有 切片 方式 ， 对 于 数字 型 的 索引 ， 用 法 类 似 Python 的 列 


表 的 索引 
的 数值 。 


用 法 ， 并 且 访 问 范围 与 Python 列表 相同 ， 不 包含 末 值 ， 例 如 下 面 的 方式 不 包含 下 标 5 


>>> s0[0:5] 
0  -1.079665 
1 1.122284 
2 0.212255 
3  -0.537349 
4 -0.369928 
dtype: float64 


但 对 于 指定 的 索引 ， 即 s1,s2,s3 的 方式 ， 包 含 末 尾 的 索引 值 ， 例 如 : 
>>> sI['A'C] 
A 0.223138 
B -0.128970 
C 1.142297 
124.3 DataFrame 的 创建 
DataFrame 是 一 个 二 维 数据 ， 行 具有 索引 ， 列 可 能 由 不 同 数据 类 型 构成 。 可 将 
DataFrame 看 作 Excel 表格 或 者 SQL 表格 或 者 Series 对 象 的 字典 。DataFrame 可 由 下 列 形式 
构成 : 
€ 由 一 维 ndarray、 列 表 、 字 典 或 者 Series 构成 的 字典 。 
€ 二 维 numpy.ndarray o 
e 结构 或 记录 的 ndarray。 


e 另外 一 个 DataFrame。 


下 面 
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是 通过 列表 、Series 字典 、 列 表 字 典 生成 DataFrame 数据 的 示例 。 


>>> import pandas as pd 
>>> import numpy as np 
>> 

>>> df0 =pd.DataFrame( [[10,20,30,40],[23,34,45,56] ,[7,8,9],[9,7,5],[1,2,3]], 
columns=['column1',"column2","column3","column4"] 
i index-['a'/b' ,c'/d','e']) 

>>> dfü 


column] column2 column3 column4 
a 10 20 30 40 
b 23 34 45 56 
c 7 8 9 NaN 
d 9 7 5 NaN 
e 1] 2 3 NaN 


>>> d-('one':pd.Series([1,2,3 ],index-(['a',b"'c']), 
'two':pd.Series([4,5,6,7 | index-[ 
'a'b''c''d']) 
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T H 
>>> dfl -pd.DataFrame(d) 
>>> dfl 
one two 
a 1] 4 
b 2 5 
c 3 6 
d NaN 7 


>>> df2-pd.DataFrame( [ ('a': 1, 'b': 2, 'c': '3'}, 


>>> df2 
a b 
0 1 2 


(a2, 'b':1}, (c1) DAS Bi nak 


c 
3 


1 2 1 NaN 


2 NaN NaN 


1 


>>> df3= pd.DataFrame( ('a'[1,3,5,7,], 'b':[2,4,6,8,])) 


>>> df3 


Q N=- O 
nuwe 
S + N O 


8 


>>> df4-pd.DataFrame(np.arange(30).reshape(5,6), 


>>> df4 


index! 0 
index2 6 
index3 12 
index4 18 
index5 24 


上 面 的 代码 中 ， 
数据 在 数据 处 理 中 


index=["index1","index2","index3","index4","index5" |, 
columns-list("abcdef") 


) 


7 8 9 10 1 
13 14 15 16 17 
19 20 21 22 23 
25 26 27 28 29 


df0. dfl, df2 包含 了 NaN 数据 ，NaN 在 pandas 中 表示 数据 缺失 。 缺 失 
比较 常见 。NumPy 中 也 提供 np.nan/npNaN 来 代替 缺失 值 ， 并 使 用 


np.isnan() 来 判定 数组 中 是 否 存在 NaN。pandas 针对 数据 缺失 ， 提 供 了 isnull (判断 是 否 缺 


失 )、dropna GEJE 


失 数据 )、filina《〈 指 定 值 或 者 插值 方式 填充 缺失 数据 ) 函数 。 


12.4.4 DataFrame 的 索引 访问 


对 DataFrame 执行 [] 操 作 符 可 返回 相应 的 列 ， 传 递 给 [] 的 参数 可 以 是 一 个 对 象 或 者 一 个 
列表 数据 ， 返 回 的 数据 类 型 可 能 是 Series 或 者 原 DataFrame 的 子 集 。 下 面 对 DataFrame 进行 


的 索引 均 以 df4 为 例 


进行 说 明 , df 有 5 行 (Hlindexl. index2. index3. index4. index5), 6 


列 数 据 ( 即 "a"、 "b". "e", "d". "e". nf"), 
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子 集 ， 例 如 : 
>>> df4["a"] 
index1 
index2 6 
index3 12 
index4 18 
index5 24 


Name: a, dtype: int32 
>>> df4[["a","b","c"]] 

a b c 
indexl 0 1 2 
index2 6 7 8 
indexX3 12 13 14 
index4 18 19 20 
index 24 25 26 


实际 上 列 名 同时 是 DataFrame 的 属性 ， 可 


>>> df4.a 

index1 0 
index2 6 
index3 12 
index4 18 
index5 24 


Name: a, dtype: int32 


日 列 名 或 者 列 名 构成 的 列表 ， 将 分 别 返 回 Series 或 者 DataFrame 的 


通过 如 下 方式 访问 : 


如 果 索 引 是 列 的 位 置信 息 构 成 的 列表 ， 将 返回 DataFrame 的 子 集 ， 例 如 
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>>> dfA[[1,5]] 


b f 
indexl 1] $5 
index2 7 11 


index3 13 17 
index4 19 23 
index5 25 29 


>>> df4[:3] 

& b 6d. eo f 
indexl 0 1] 2 3 4 5 
indx2 6 7 8 9 10 I 
index3 12 13 14 15 16 17 
>>> df4[3:6] 

& bu ë de ges f 
index4 18 19 20 21 22 23 
index 24 25 26 27 28 29 


上 述 方法 获取 的 数据 均 是 以 列 为 单位 的 。 下 面 是 以 列 为 单位 获取 数据 的 方法 : 


IT 
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除了 常用 [索引 方式 ， 男 有 儿 种 DataFrame 的 访问 方式 : loc/iloc、ix 和 at/iat。 
loc 的 参数 为 行 索引 名 或 者 行 索引 名 构成 的 列表 ，iloc 为 行 索引 号 。lociloc 的 返回 值 可 
能 是 Series， 也 可 能 是 DataFrame。 例 如 : 


>>> df4.loc["index1"] 
0 


= @ @ G go ° 


1 
2 
3 
4 
5 


Name: index], dtype: int32 
>>> df4.loc["index1":"index3"] 

a b c d e f 
indexl 0 1 2 3 4 5 
indx2 6 7 8 9 10 | 
index3 12 13 14 15 16 17 
>>> dfA.loc[["index1","index3"]] 

a b c d e f 
indexl 0 1 2 3 4 5 
index3 12 13 14 15 16 17 
>>> df4.loc["index2":] 

a b c d e f 
indx2 6 7 8 9 10 | 
index3 12 13 14 15 16 17 
index4 18 19 20 21 22 23 
index5 24 25 26 27 28 29 
>> 
>>> df4.iloc[0] 

0 


== @ c. G To 


1 
2 
3 
4 
5 


Name: index], dtype: int32 
>>> df4.iloc[0:3] 

a b c d e f 
indexl 0 1] 2 3 4 5 
indx2 6 7 8 9 10 Il 
index3 12 13 14 15 16 17 
>>> df4.iloc[:3] 

a b c d e f 
indexl 0 1] 2 3 4 5 
indx2 6 7 8 9 10 Il 
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除了 d 人 .ix[10] 的 方式 返回 相应 的 具体 元 素 值 ，at 也 可 返回 


Series 的 方式 也 可 返回 具体 的 元 素 值 。 例 如 : 


表 12-2 是 DataFrame 的 索引 方式 总 结 。 
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index3 


ix 可 返回 


14 15 16 17 


>>> df4.ix['index1] 


= 0 àa O oco ° 


0 


1 
2 
3 
4 
5 


Name: indexl, dtype: int32 
>>> dfAx["index1":"index3"] 


indexl 


index2 


index3 
>>> dfAx[["index1","index3"]] 


index1 
index3 

>>> df4.ix[1] 
a 6 

b 7 

c 8 

d 9 

e 10 

f 11 


b 


7 
13 


b 


13 


c d e f 
2x e d 
8 9 10 Il 
14 15 16 17 
€. d sec 
2- 39:4 5 
14 15 16 17 


Name: index2, dtype: int32 


>>> df4.ix[1,0] 


6 


>>> df4.iat [0,1] 


1 


>>> dfA.at["index1","a"] 


0 


>>> dfA["a"][index1"] 


0 


>>> df4.a["index1"] 


0 


DataFrame, Series 以 及 具体 的 元 素 值 。 例 如 : 


HR 


AN 


体 的 元 素 值 。 通 过 访问 


第 123 大 数据 的 利器 
表 12-2 DataFrame 索引 和 选择 操作 方法 
操作 语法 结果 
选择 列 df[col] Series 
标签 形式 选择 行 dfloc [lable] Series 
整数 位 置 选择 行 dfiloc[loc] Series 
切片 选择 行 df[5:10] DataFrame 
布尔 向 量 选择 行 df[bool vec] DataFrame 
行 索引 df.ix[val] 行 数据 对 应 的 Series 
列 索 引 dfix[:,val] 列 数据 对 应 的 Series 
元 素 dfix[vall,val2] 具体 元 素 值 或 者 选中 区 域 的 Series 


12.4.5 DataFrame 的 数据 赋值 


可 以 在 创建 DataFrame 时 直接 赋值 ， 也 可 事后 弥补 。 赋 值 列 表 数 据 时 ， 需 与 原 
DataFrame 的 维 数 相同 ， 赋 值 Series 数据 时 无 此 要 求 。 下 面 分 别 是 赋值 列表 数据 、NumPy 数 


据 和 Series 的 例子 。 


>>> dfA[" AA"]-11st((1,2,3,4,5)) 
>>> dfA[" BB"]-np.ones((5,2)).tolist() 
>>> dfA["CC"]-pd.Series((1,5,0,8,6) index-("index1","index2","index3","index4","index5") ) 


>>> df4 


index] 0 1| 
index2 6 7 
index3 12 13 
index4 18 
index5 24 


12.4.6 


些 运算 : 


>>> df0.sum() 


columnl 50 
column2 71 
column3 92 


column4 96 
dtype: float64 


可 见 ，df0.sumO 的 计算 是 以 列 为 基 而 
HIO JAAD 或 者 1 (对 应 行 )。 下 面 的 代码 将 返 


取 


SN 


8 
14 


>>> dfÜü.sum(axis-1) 


a 100 


d 


15 


19 20 21 
25 26 27 


e 


28 


DataFrame 的 基本 运算 
既然 pandas 的 基础 是 NumPy， 那 么 它 


f AA 
5 1 [10,1.] 
11 2 [10,10] 
17 3 [1.0, 1.0] 
23 4 [1.0,1.0] 
29 5 [1.0,1.0] 


1 


ON oo Q tA 


BB CC 


然 不 会 缺少 NumPy HERSE REJ. F 


H 


进行 计算 的 。DataFrame 提供 了 axis 属性 ，axis 的 
各 行内 数据 的 和 。 
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b 
c 
d 21 
e 


dtype: float64 


dfo 的 数据 中 存在 部 分 NaN 值 ， 默 认 情 况 跳 过 NaN 值 ， 但 可 通过 skipna 参数 处 理 存在 
NaN 值 的 情况 ， 例 如 


>>> df0.sum(skipna=False) 


columnl 50 
column2 71 
column3 92 


column4 NaN 
dtype: float64 


describeO 函 数 可 以 一 次 性 产生 多 个 汇总 统计 ， 例 如 : 


>>> df0.describe0#7[ ` 4 Zi 
column1 column2 column3 column4 

count | 5.000000 . 5.000000 . 5.000000 2.000000 
mean 10.000000 14.200000 18.400000 48.000000 
std 8.062258 12.891858 18.352112 11.313708 
min 1.000000 2.000000 3.000000 40.000000 
2596 7.000000 — 7.000000 | 5.000000 44.000000 
5096 9.000000 — 8.000000 9.000000 48.000000 
75% 10.000000 20.000000 30.000000 52.000000 
max 23.000000 34.000000 45.000000 56.000000 


12.4.7 pandas 的 IO 操作 


pandas 的 IO API 为 pandas 提供 数据 源 。 目 前 pandas 支持 下 列 文件 的 读 写 操作 : CSV. 
Excel 2003/2007 、JSON 、HTML 、 剪 贴 板 、PyTableMHDFS 、Stata pickle, j (E T 
read csv ~ read excel. read hdf read sql. read json 、 read html. read stata 、 read 
clipboard. read pickle 等 加 载 函 数 以 及 to csv. — to excel. to hdf to sql to json 、 
to html. to stata. to clipboard. to pickle 等 转换 函数 。 下 面 以 JSON 和 Excel 文件 操作 为 例 
说 明 其 用 法 。 


>>> import StringIO 

>>> df0.to json() 

' f"column1": ("a":10,"b":23,"c":7,"d":9,"e":13,"column2": ("a":20,"b":34,"c":8,"d":7,"e":2),"column3": (" 
a":30,"b":45,"c":9,"d":5,"e":3),"column4": ("a":40.0,"b":56.0,"c":null,"d":null,"e":null] ' 

>>> mylIO-StringIO.StringlIO() 

>>> mylIO-df0.to json() 

>>> jsondata-pd.read json(myIO) 

>>> jsondata 


column] column2 column3 column4 


240 


$123 大 数据 的 利器 


a 10 20 30 40 
b 23 34 45 56 
c 7 8 9 NaN 
d 9 7 5 NaN 
e 1 2 3 NaN 


>>> df0.to excel("c:Wexceldata.xls") 
exceldata-pd.read excel("c:Vexceldata.xls") 
>>> >>> exceldata 


column] column2 column3 column4 


a 10 20 30 40 
b 23 34 45 56 
c 7 8 9 NaN 
d 9 7 5 NaN 
e 1 2 3 NaN 


查看 C: 盘 下 的 exceldata.xls 内 容 ， 如 图 12-1 所 示 。 


2 
3 
4 
5 
6 
Ed 
8 


9 


10 — 
M 4 h rh Sheeti/ p‘ 3 


图 12-1 通过 pandas 写 Excel 文件 


12.4.8 pandas 读 取 EIA 的 原油 价格 


pandas 还 提供 了 直接 读 取 网 络 数据 的 方式 ， 可 以 读 取 Yahoo 财经 、Google 财经 、 美 国 
圣路易斯 联储 (St. Louis Fed)、 世 界 银 行 等 数据 源 。 也 有 一 些 Python 财经 数据 接口 包 ， 如 
tushare 软件 (http://tushare.org/index.html)， 是 针对 中 国 金 融 数据 的 。 

下 面 的 代码 演示 华 宝 油 气 基金 与 原油 价格 关系 图 。 华 宝 油气 (162411) 是 跟踪 标 普 石 油 
天 然 气 上 游 股 票 指 数 的 QDII， 可 通过 tushare 获取 其 历史 数据 。 

美国 能 源 信息 团 (EIA) 提供 了 Excel 格式 的 原油 历史 价格 。pandas 的 read excel P 
数 ， 可 直接 读 取 本 地 /网 络 的 Excel 文件 ，pandas 通过 指定 Excel 文件 中 的 sheetname 读 取 相 
应 表 并 直接 生成 DataFrame， 将 股票 数据 stockdata (Series 类 型 ) 直接 赋值 给 oildata。 

pandas 的 DataFrame 提供 plot， 可 直接 调用 Matplotlib 的 绘图 函数 。pandas 与 tushare 联合 
使 用 ， 可 以 同时 显示 华 宝 油 气 与 原油 价格 〈 美 元 )。 执 行 结果 如 图 12-2 所 示 《 华 宝 油气 价格 放 
大 80 倍 。 本 图 只 是 显示 相关 性 ， 不 代表 真实 价格 )。 


gu 
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# encoding:utf-8 

# Vusr/bin/python 

import pandas as pd 

import numpy as np 

import pandas.io.data as web 
import datetime 

import tushare as ts 

import matplotlib 
matplotlib.use("TkKA gg") 


from matplotlib import pyplot as plt 
from matplotlib import pylab 
def Oil(): 


pylab.mpl.rcParams['font.sans-serif] = ['SimHei'] #4% 
pylab.mpl.rcParams['axes.unicode minus'] = False # fs FX 
stockdata —ts.get hist data('162411"[ 'close'] # 一 次 性 获取 全 部 日 k 线 数 


stockdata.index-pd.to datetime(stockdata.index) 

Heia 网 提供 了 原油 价格 表 
oilurl='http://www.eia.gov/dnav/pet/hist_ xIs/RWTCd.xls' 
#pandas tett T H] 


Be JA H/ EERE Excel 文件 的 read_excel 函数 。 


oildata = pd.read excel(oilurl ,sheetname-'Data 1',skiprows-50,index col-0) 
oildata.columns =[" 原 油 ' 堪 更 改 列 名 
oildata['162411']=stockdata*80# 放 大 80 倍 ， 图 形 显示 直观 


oildata.index.name-u" E jl ^ 5 Je 


"ERRI, Matplotlib 显示 用 


pi 


f print oildata['2014-02-13': ffi H1 PEE ZH 
oildata['2013-01-01':] .plot() 
plt.show() 


name ==" main ": 


Oil) 


h h ° 
oN oN 
"o " ~ 


MSN 
3» ow A ç 


AN 
Ne J 


k 


N 


十 


—— Crude Oil 
— 162411 
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华 宝 油气 与 原油 


12-2 ”通过 pandas 获取 原油 
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上 例 演 示 了 pandas 从 数据 采集 到 数据 处 理 的 过 程 ， 读 者 可 根据 需求 自行 设计 一 些 案 
例 ， 例 如 黄金 价格 等 其 他 经 济 数据 或 者 计算 机 系统 日 志 数据 均 可 作为 pandas 的 分 析 对 象 。 


125 小结 


数据 收集 、 数 据 准 备 、 数 据 转 换 、 数 据 建 模 和 计算 、 图 形 化 展示 是 数据 处 理 的 几 个 步 
又 。 本 章 演 示 了 JSON, XML, Excel, PyTables 的 数据 处 理 方法 。 收 集 数据 没有 固定 模式 ， 
网 络 上 的 数据 源 寻 找 可 借助 Chrome 或 者 Firefox 的 开发 者 工具 ，14.1 节 演 示 了 将 类 JSON 数 
据 转换 为 JSON 数据 处 理 的 过 程 。pandas 是 目前 Python 数据 处 理 标 准 ， 集 成 了 数据 收集 、 规 
整 、 聚 合 、 统 计 和 图 形 化 演示 功能 ， 在 12.4 节 中 演示 了 通过 pandas 进行 数据 收集 、 数 据 处 
理 、 数 据 图 形 化 的 过 程 。 
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附录 A Python 编译 安装 


第 1 章 给 出 了 Windows 下 的 Python 2 安装 , 而 多 数 Linux 发 行 包 默认 安装 Python 2 版 本 ， 
对 版 本 没有 特殊 要 求 的 用 户 可 以 直接 使 用 。 但 有 时 用 户 可 能 需要 执行 新 版 本 的 Python。 由 于 
可 能 受到 管理 员 权限 、 资 源 有 限 、 缺 乏 特殊 的 Linux 软件 包 等 因素 的 限制 ， 在 大 学 集群 、 公 
司 服务 器 或 者 共享 虚拟 主机 上 安装 最 新 的 Python 版 本 有 时 是 不 可 能 的 ， 但 在 Linux 系统 中 ， 
用 户 可 将 新 版 本 的 Python 安装 在 自己 的 目录 中 。 下 面 以 在 Debian 系统 中 安装 Python 3.4.3 为 
例 说 明 如 何在 用 户 自己 的 目录 内 安装 新 版 本 的 Python。 

(1) 通过 apt-get install build-essential 命令 获得 各 种 开发 工具 。apt-get 是 一 条 Linux 命 
令 ， 适 用 于 基于 deb 包 的 Linux 发 行 版 ， 主 要 用 于 自动 从 互联 网 的 软件 仓库 中 搜索 、 安 装 、 


人 一 


升级 、 印 载 软件 。 下 面 是 以 上 命令 的 执行 过 程 。 
正在 读 取 软 件 包 列 表 ... 完成 
正在 分 析 软 件 包 的 依赖 关系 树 
正在 读 取 状态 信息 ... 完成 


将 会 安装 下 列 额 外 的 软件 包 : 
dpkg-dev g++ g++-4.7 libalgorithm-diff-perl libalgorithm-diff-xs-perl 
libalgorithm-merge-perl libdpkg-perl libfile-fentllock-perl 
libstdc--7-6-4.7-dev 
建议 安装 的 软件 包 : 
debian-keyring g++-multilib g++-4.7-multilib gcc-4.7-doc libstdc++6-4.7-dbg 
libstdc++6-4.7-doc 
下 列 【 新 】 软 件 包 将 被 安装 : 
build-essential dpkg-dev g++ g++-4.7 libalgorithm-diff-perl 
libalgorithm-diff-xs-perl libalgorithm-merge-perl libdpkg-perl 
libfile-fcntllock-perl libstdc--7-6-4.7-dev 
升级 了 0 个 软件 包 ， 新 安装 了 10 DEIF, BR 0 个 软件 包 ， 有 0 个 软件 包 未 被 升级 。 
需要 下 载 2.325 kB/11.9 MB 的 软件 包 。 
解压 缩 后 会 消耗 掉 30.3 MB 的 额外 空间 。 
您 希望 继续 执行 吗 ? [Y/n]y 
更 换 介质 : 请 把 标 有 
“Debian GNU/Linux 7.7.0 Wheezy - Official i386 DVD Binary-1 20141018-11:53" 
的 盘 片 插入 驱动 器 media/cdrom/” 再 按 回 车 键 
IRW: 1 http://security.debian.org/ wheezy/updates/main libdpkg-perl all 1.16.16 [963 kB] 
IRW: 2 http://security.debian.org/ wheezy/updates/main dpkg-dev all 1.16.16 [1,362 kB] 
下 载 2,325 kB, FEIF 40 fb (56.7 kB/s) 
Selecting previously unselected package libstdc++6-4.7-dev. 
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(正在 读 取 数据 库 .… 系统 当前 共 安 装 有 146281 个 文件 和 目录 。) 


Kää libstdc++6-4.7-dev (从 ..Vlibstdc++6-4.7-dev 4.7.2-5 1386.deb) ... 


Selecting previously unselected package g++-4.7. 


玉 缩 g++-4.7 (从 .../g-+-4.7_4.7.2-5 i386.deb) ... 


Selecting previously unselected package g++. 


玉 缩 g++ (从 ./g++H 4.72-1 i1386.deb) ... 


Selecting previously unselected package libdpkg-perl. 


玉 缩 libdpkg-perl (从 .../libdpkg-perl. 1.16.16 all.deb) ... 


Selecting previously unselected package dpkg-dev. 


Kää dpkg-dev (从 ../dpkg-dev 1.16.16 all.deb) ... 


Selecting previously unselected package build-essential. 


Kğ build-essential (从 .../build-essential 11.5 i386.deb) .… 


Selecting previously unselected package libalgorithm-diff-perl. 


Kää libalgorithm-diff-perl (从 .../libalgorithm-diff-perl 1.19.02-2 all.deb) ... 


Selecting previously unselected package libalgorithm-diff-xs-perl. 


Kää libalgorithm-diff-xs-perl (从 .../libalgorithm-diff-xs-perl 0.04-2-b1 i386.deb)... 


Selecting previously unselected package libalgorithm-merge-perl. 


Kää libalgorithm-merge-perl (从 ../libalgorithm-merge-perl 0.08-2 all.deb) ... 


Selecting previously unselected package libfile-fcntllock-perl. 


:在 解 


Kää libfile-fentllock-perl (从 .../libfile-fcntllock-perl 0.14-2 1386.deb) ... 


:在 处 理 用 于 man-db 的 触发 器 ... 


在 设置 libdpkg-perl (1.16.16) … 


在 设 


置 dpkg-dev (1.16.16) .… 


正在 设置 libalgorithm-diff-perl (1.19.02-2) ... 
正在 设置 libalgorithm-diff-xs-perl (0.04-2--b1) ... 
正在 设置 libalgorithm-merge-perl (0.08-2) ... 
正在 设置 libfile-fcntllock-perl (0.14-2) ... 

正在 设置 g++-4.7 (4.7.2-5) ... 


:在 设置 g++ (4:4.7.2-1) ... 


update-alternatives: using /usr/bin/g-— to provide /usr/bin/c--- (c++ in 自动 模式 


:在 设置 build-essential (11.5) ... 


置 libstdc---6-4.7-dev (4.7.2-5) ... 


(2) 在 安装 完 开发 环境 后 ， 进 行 Python 的 下 载 、 编 译 和 安装 。 首 先 从 www.python.org 
获取 Python 源 代码 。 


$ wget http://www.python.org/ftp/python/3.4.3/Python-3.4.3.tgz 


wget 命令 是 一 个 从 网 络 上 自动 下 载 文件 的 工具 ， 支 持 HTTP、HTTPS、FTP， 并 可 以 使 


H HTTP 代理 。 


G) 建立 目 


T 
l 


录 /home/test/python3.4， 作 为 Python 3.4 的 安装 目录 。 解 压 文件 并 改变 目录 。 


$ tar xfz Python-3.4.3.tgz 
$ cd Python-3.4.3 


(4) 使 用 计划 安装 Python 的 目录 路 径 配 置 它 : 


$ /configure --prefix-/home/test/python3.4 
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(5) 编译 


$make 
$make install 


~/python3.4/bin 


安装 完 Python 标准 版 后 ， 可 通过 easy install. pip 安装 相应 的 Python 包 。 


附录 B virtualenv Python 虚拟 环境 


Python 的 背后 有 着 庞大 的 开源 社区 支持 ， 但 是 有 一 个 缺点 就 是 每 个 包 的 质量 参差 不 齐 ， 
如 果 在 工作 服务 器 上 测试 安装 每 个 包 ， 会 使 整个 服务 器 形成 庞大 、 复 杂 的 第 三 方 包 依 赖 。 

virtualenv 就 是 为 了 解决 这 个 问题 而 产生 的 ， 它 可 以 在 用 户 的 目录 中 生成 若干 个 虚拟 的 、 
独立 的 、 专 属于 某 一 项 目的 Python 环境， 不 但 解决 了 包 版 本 冲突 问题 ， 也 可 以 避免 因 某 人 无 
意 修改 了 全 局 site-packages 目录 而 造成 整个 开发 环境 改变 之 类 的 问题 。 

virtualenv 具有 以 下 特点 : 

e 能 够 在 没有 权限 的 情况 下 安装 新 套件 。 

e 不 同 应 用 可 以 使 用 不 同 的 套件 版 本 。 

e 套件 升级 不 影响 其 他 应 用 。 

下 面 分 别 说 明 在 Debian GNU/Linux 7.7.0 Wheezy 与 Windows 环境 下 virtualenv 的 安装 过 程 
(1) Debian GNU/Linux 7.7.0 Wheezy 环境 下 virtualenv 的 安装 过 程 : 
首先 通过 apt-get install 安装 easy_install。 然 后 通过 easy install 安装 virtualenv。 


root@debian:/home/test# apt-get install python-setuptools 
root(gdebian:/home/test£ easy install virtualenv 


下 面 的 命令 创建 Python 虚拟 环境 ， 该 命令 只 有 一 个 必需 的 参数 ， 即 虚拟 环境 的 目录 。 
执行 该 命令 后 ， 会 在 当前 目录 下 出 现 一 个 子 文件 夹 ， 名 字 为 virtualenv 对 应 的 参数 ， 本 例 


Jj env. 


test&)debian:-$ virtualenv env 
New python executable in env/bin/python 
Installing setuptools, pip, wheel...done. 


在 新 建 的 env 虚拟 环境 〈 子 文件 夹 ) 中 ， 保 存 了 一 个 全 新 的 虚拟 环境 ， 即 一 个 私有 的 
Python 解释 器 。 在 使 用 该 解释 器 之 前 ， 需 要 将 其 激活 ， 命 令 如 下 : 
test@debian:~$ cd env 
test()debian:-/env$ source bin/activate 


执行 激活 命令 后 ， 此 时 已 经 进入 虚拟 环境 ， 可 注意 一 下 test@debian 前 级 中 增加 了 一 个 虚 
拟 环境 的 名 字 。 在 该 虚拟 环境 下 ， 可 执行 pip 命令 安装 各 种 软件 包 。 但 所 有 的 虚拟 环境 下 的 
操作 不 会 影响 到 env 虚拟 环境 以 外 的 Python 解释 器 。 
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Scripts 目录 下 的 。 下 面 是 Windows 下 的 virtualenv 建立 过 程 : 


解释 器 ， 另 外 就 是 安装 包 管 


fr? 


附录 


(env)test@debian:~/env$ pip install flask 


可 通过 如 下 命令 返回 默认 的 Python. 解释 器 环境 。 


(env)test(@debian:deactivate 


(2) Windows 下 的 virtualenv 与 Linux 的 最 主要 区 别 是 :virtualenyv 的 激活 命令 是 存放 在 


C3AAnaconda Scripts»virtualenv myenv 


New python executable in myenv Scripts Wpython.exe 


Installing setuptools, pip, wheel...done. 


C:\Anaconda\Scripts>cd myenv 


C:VAnaconda NScriptsumyenv>cd scripts 


C^AnacondaNScriptsmmyenv Scripts»activate.bat 


(myenv) C^Anaconda Scriptsmyenv Scripts? 


安装 完 Python 虚拟 环境 后 ,可 看 一 下 Scripts HK FAR, BRT activate 激活 命令 .Python 


In 


里 器 : easy install, pip. wheel. eays install 与 pip 在 本 书 中 做 过 
, wheel 是 男 外 一 球 包 安装 器 ， 用 于 安装 .whl 文件 。 


T 


(myenv) CAAnaconda ScriptsmyenvScripts»dir 
驱动 器 C 中 的 卷 是 Windows7 OS 
卷 的 序列 号 是 20CC-E20F 
Ci\Anaconda\Scripts\myenv\Scripts 的 目录 


2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 
2015-08-11 


T 
PyCharm 支持 创建 虚拟 环境 ， 在 本 书 中 已 经 做 过 介绍 。 


22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 
22:07 


14 个 文件 3,659277] 字 节 


2v 


<DIR> 
<DIR> i 
2,307 activate 
557 activate.bat 
8,325 activate.psl 
1,137 activate this.py 
348 deactivate.bat 
95,614 easy install-2.7.exe 
95,614 easy install.exe 
95,586 pip.exe 
95,586 pip2.7.exe 
95,586 pip2.exe 
27,136 python.exe 
3,018,240 python27.dll 
27,648 pythonw.exe 
95,593 wheel.exe 


3k 232,808,726,528 可 用 字 
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附录 C Python 2 还 是 Python 3 


目前 是 Python 2 与 Python 3 共存 阶段 。 为 什么 说 是 共存 呢 ? 因为 Python 3 不 是 完全 兼容 


Python 2，Python 2 也 在 不 断 加 入 Python 3 的 新 特性 。 如 果 初 学 Python， 建 议 用 Python 2， 因 


为 学 习 资料 较 多 ; 如 果 是 程序 员 开 发 新 的 程序 ,建议 直接 使 用 Python 3, 目前 一 些 著 名 的 Python 
软件 包 已 经 支持 Python 3， 例 如 NumPy、SciPy、pandas、Matplotib 。 可 在 Anaconda 的 包 列 


表 中 查看 目前 Python 3 所 支持 的 软件 包 (http://docs. continuum.io/anaconda/pkg-docs )。 


下 面 是 一 些 Python 2 与 Python 3 的 主要 差异 : 

1) Python 3 中 去 掉 了 raw input 函数 ， 只 有 input 函数 。 

2) Python 3 中 的 字符 串 只 有 str 一 种 类 型 ， 但 它 与 2.x 版 本 的 unicode 几乎 一 样 。 所 以 
Python 3 中 不 再 包含 encode 和 decode 函数 。 下 面 是 相关 代码 在 Python 3.4 中 的 运行 结果 。 


>>> u'"Ne9".decode("utf-8") 
Traceback (most recent call last): 
File "<pyshell#11>", line 1, in <module> 
u"\e9".decode("utf-8") 
AttributeError: 'str' object has no attribute 'decode' 
>>> b"xe9".encode("utf-8") 
Traceback (most recent call last): 
File "<pyshell#12>", line 1, in «module 
b'xe9".encode("utf-8") 
AttributeError: 'bytes' object has no attribute 'encode' 


3) Python 3 的 字符 串 开始 使 用 format， 并 反问 延伸 到 Python 2.6 "P. Python 3 中 ，% 格 
式 化 仍旧 存在 ， 不 管 使 用 Python 3 还 是 Python 2 进行 开发 ， 最 好 直接 使 用 format 字符 串 格式 
M o Python 关于 字符 串 格式 化 的 变迁 很 像 C 语言 的 字符 串 格式 化 过 渡 成 C# 语 言 的 字符 串 格式 
化 。format 字符 串 格式 的 用 法 如 下 : 


"{0} {1}".format(a,b) 


人 表示 占 位 符 ， 其 中 的 数字 对 应 format 内 的 参数 位 置 。 例 如 下 面 的 例子 中 ，s 字符 串 的 
format 提供 了 两 个 参数 ， 但 通过 {0} 与 41} 可 找到 相应 参数 。 


>>>"I love {0}, {1}, and (2j "-format("eggs", "bacon", "sausage") 

'I love eggs, bacon, and sausage' 

>>> s-"hello {0},from {1},your name is (0j ".format("john","china") 
>>s 


'hello john,from china,your name is john' 


format 形式 相 比 % 格 式 有 个 很 大 的 优点 ,就 是 参数 个 数 通 过 全 内 的 占 位 符 数 字 可 以 清晰 地 


表示 出 来 ， 避 免 输入 个 数 有 误 。 


除了 上 面 的 数字 形式 ， 还 可 采用 如 下 形式 : 
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>>> s=" I {verb} the (object) off the (place) ".format(verb-"took",object-"cheese 


"place-"table") 


附录 


>>>S 
' I took the cheese off the table' 


通过 format 可 进行 进 制 的 转换 ， 例 如 下 面 进行 十 进 制 、 十 六 进 制 、 八 进 制 、 二 进 制 的 转换 : 


>>> print (" (0:dj, {0:x}, (0:0), {0:b}".format(15) ) 
15, £17,1111 


4) Python 2 的 print 是 一 个 语句 ，Python 3 的 print 是 一 个 函数 ，print 后 面 的 括号 不 能 


少 。 


BZ 
Python 2 中 可 通过 from — future — import print function 向 后 兼容 print 函数 。 表 C-1 是 一 些 
者 调用 的 区 别 。 


表 C-1 print 对 比 


Python 2.7 Python 3.4 
>>> print ("hello world" ) >>> print( "hello world") 
hello world hello world 
>>> print "hello world" >>> print "hello world" 
hello world SyntaxError: Missing parentheses in call to 'print' 
>>> print 1,2, >>> print 1,2 
12 SyntaxError: Missing parentheses in call to 'print' 
>>> print (1,2) >>> print (1,2) 
(1,2) 12 
>>> print ((1,2)) >>> print ((1,2)) 
(1,2) (1,2) 


5) Python 3 的 整数 除法 更 贴近 生活 ， 而 不 是 采用 C 语言 的 整数 除法 ，Python 2 也 可 通过 
from future import division. 使 除法 更 符合 人 们 的 生活 习惯 。 表 C-2 是 二 者 的 区 别 。 


表 C-2 除法 对 比 


python 2.7 Python3.4 
>>> 1/2 >>> 1/2 
0 0.5 
>>> 1.0/2 >>> 1.0/2 
0.5 0.5 
>>> 1/2.0 >>> 1/2.0 
0.5 0.5 


6) Python 3 中 将 int 型 与 long 型 统一 。 表 C-3 是 Python 2.7 与 Python 3.4 的 对 比 。 


表 C-3 intlong 型 对 比 


Python 2.7 Python3.4 


>>> type(10) >>> type(10) 

«type 'int'> «class 'int'> 

>>> type(0xFFFFFFFF) >>> type(0xFFFFFFFF) 
«type long> «class 'int'> 


Pod 


7) Python 2 中 的 八进制 数字 〈octal) 以 0 开头 ， 而 Python 3 中 的 八进制 数字 以 00 开头 ， 
目前 Python 2 也 文 持 该 形式 。 但 oct 函数 的 返回 值 是 不 同 的 .Python 2 中 返回 以 0 开头 的 数字 ， 
而 Python 3 的 返回 值 以 00 开头 。 表 C-4 是 两 个 版 本 中 有 关 八 进 制 数字 的 对 比 。 
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表 C-4 八进制 数字 区 别 


Python 2.7 Python3.4 
>>> 00666 >>> 00666 
438 438 
>>> 0666 >>> 0666 
438 File "<stdin>", line 1 
>>> oct(438) 0666 
'0666' A 
SyntaxError: invalid token 
>>> oct(438) 
'00666' 


8) Python 3 删除 了 xrange, DU range, J£ H.j Python 2 也 稍微 有 些 差别 ， 表 C-5 是 
二 者 区 别 。 


表 C-5 range 差别 


Python 2.7 Python 3.4 
>>> x-range(1,5) >>> x-range(1,5) 
>>> print x >>> print (x) 
[1, 2, 3, 4] range(1l, 5) 
>>> type(x) >>> x 
<type 'list'> range(1, 5) 
>>> type(x ) 
«class 'range'> 


9) Python 2 支持 > 作为 != 的 同义词 。Python 3 只 支持 !=， 不 再 支持 <>。 
10) Python 3 与 Python 2 的 异常 语法 有 所 变化 。Python 2 支持 以 下 两 种 异常 语 光 


except ValueError as e: 


N 


except ValueError ,e: 
但 Python 3 f xfi: 
except ValueError as e: 
对 于 多 个 异常 形式 ，Python 3 采用 如 下 方式 。 
except (ValueError, TypeError) as e: 
对 于 raise 语句 ，Python 2 支持 如 下 方式 : 
raise ValueError('Invalid value") 
fH Python 3 仅 文 持 函 数 参数 形式 ， 即 
raise ValueError('Invalid value") 
在 Python 2 中 使 用 异常 时 ， 推 荐 直接 使 用 与 Python 3 中 相同 的 语法 结构 。 
11) 在 Python 3 中 ，StringIO 与 cStringIO 模块 消失 ， 用 io 模块 取代 ， 使 用 io.StringIO 或 
者 io.BytesIO 用 于 字符 串 的 流 操作 。 移 除了 cPickle 模块 ， 可 以 使 用 pickle 模块 代 蔡 。 移 除了 


imageop、 audiodev、 Bastion, bsddb185. exceptions, linuxaudiodev、 md5. MimeWriter、 mimify. 


popen2. rexec. sets. timing. xmllib 等 模块 。 

12) urllib 与 urllib2 是 Python 2 中 常用 的 读 取 URL 内 容 的 模块 ， 但 这 两 个 模块 不 能 相互 
替代 。urllib2 可 以 接受 一 个 Request 类 的 实例 来 设置 URL 请 求 的 headers，urllib 仅 可 以 接受 
URL。 这 意味 着 ， 你 不 可 以 伪装 你 的 User Agent 字符 串 等 。Python 3 将 这 两 个 模块 进行 了 整 
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附录 


合 ， 统 一 到 urllib 模块 中 。 表 C-6 是 两 个 版 本 中 的 urllib 使 用 上 的 一 些 区 别 。 


Python 2.7 


表 C-6 ulib 库 差异 


Python 3.4 


import urllib 

import urllib2 

import urlparse 

import robotparser 

from urllib import FancyURLopener 
from urllib import urlencode 

from urllib2 import Request 

from  urllib2 import HTTPError 


import urllib.request, urllib.parse,urllib.error 


import urlib.request,urlib.error 


import urllib.parse 


import urllib.robotparser 


from urllib.request import FancyURLopener 


from urllib.parse import urlencode 


from urllib.request import Request 


from urllib.error import HTTPError 


13) 由 于 系统 /功能 的 变迁 、 重 复 功 能 模块 合并 、 遵 从 PEP8 的 有 关 小 写 命名 的 规定 等 原因 ， 


Python 3 的 一 些 标准 库 与 Python 2 有 所 不 同 。 表 C-7 是 二 者 之 间 的 差异 。 除了 表 C-7 提 及 引用 的 
变化 ,功能 包 的 内 部 也 发 生 了 一 些 变化 ,例如 Pyhton 2! 
体 情况 可 查阅 PEP-3108 (https:/www.python.org/dev/ peps/pep-3108/)。 


mi 


的 Tkinter 中 的 Dialog 改变 为 tkinterdialog。 


表 C-7 Python 2 5 Python 3 标准 库 差异 
Python 2 Python 3 
import anydb 
PM Ma p import dbm 
import whichdb 
import BaseHTTPServer 
import SimpleHttpServer import http.server 
import CGIHTTPServer 


import _ builtin _ 


import builtins 


import commands 


import subprocess 


import ConfigParser 


import configparser 


import Cookie 


import http.cookies 


import cookielib 


import http.cookiejar 


import copy reg import copyreg 
import dbm import dbm.ndbm 
import DocXMLPRCServer 


import SimpleXMLRPCServer 


import xmlrpc.server 


importt dumbdbm import dbm.dumb 
import gdbm import dbm.gnu 
import httplib import http.client 


import Queue 


import queue 


import repr 


import reprlib 


import robotparser 


import urllib.robotparser 


import SocketServer 


import socketserver 


import test.test support 


import test.support 


import Tkinter import tkinter 
import urlib import urllib.request,urllib.parse,urllib.error 
import urllib2 import urllib.request,urllib.error 
import urlibparse import urlib.parse 
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附录 D 科学 家 的 Python 


本 节 内 容 选 自 Julius B. Lucks (http://openwetware.org/wiki/Julius B. Lucks/Projects/) 的 文 
章 ， 主 要 分 析 了 为 何 Python 适合 科学 领域 。 经 原作 者 同意 ， 将 译文 放 于 本 书 中 ， 便 于 读者 多 
角度 了 解 Python 的 应 用 情况 。 

典型 的 科研 项 目 需要 执行 多 种 计算 任务 。 每 个 调查 的 核心 是 为 了 验证 假设 而 进行 的 数据 
生成 。 实 验 物理 学 家 制造 了 设备 收集 光 散 射 数据 ， 检 员 仪 收集 义 射线 的 衍射 数据 ; 生物 学 家 
收集 报告 基因 的 荧光 强度 值 或 这 些 基因 的 DNA 序列 ; 计算 研究 员 编 写 程序 生成 模拟 数据 。 所 
有 这 些 科学 家 使 用 计算 机 程序 控制 仪器 或 者 模拟 数据 ， 用 于 收集 和 管理 电子 形式 的 数据 。 一 
旦 数据 采集 完毕 ， 下 一 步 是 在 假设 驱动 模型 的 环境 中 进行 分 析 ， 以 便 理 解 他 们 正在 研究 的 现 
象 。 对 于 光 或 者 X 射线 散射 数据 的 情况 ， 有 成 熟 的 物理 理论 可 用 于 处 理 数据 和 计算 研究 对 象 
的 观测 结构 函数 。 这 个 结构 函数 可 与 先前 假设 的 预测 函数 进行 比较 验证 。 对 于 生物 学 的 报告 
基因 数据 ， 光 密度 要 与 表 型 特征 或 基因 序列 进行 匹配 ， 并 进行 统计 分 析 来 解释 观察 到 的 现象 。 
上 面 的 例子 表明 ， 在 科学 领域 中 ， 计 算 程序 处 理 每 项 研究 中 的 大 量 原始 数据 以 便 理解 背后 的 
真相 。 用 于 产生 不 同 种 类 绘图 的 可 视 化 工具 既是 对 正在 进行 的 实验 进行 故障 诊断 的 首选 工具 ， 
也 是 生成 用 于 发 表 的 科研 图 形 和 图 表 的 首选 工具 。 这 些 图 形 和 图 表 往 往 是 汇聚 了 大 量 数据 的 
科学 研究 成 果 的 最 终 表现 形式 ， 用 来 证 实 假说 的 真实 性 。 不 幸 的 是 ， 科 学 家 经 常 要 求助 于 一 
大 堆 工具 来 实现 不 同形 式 的 计算 任务 。 物理 学 家 和 理论 化 学 家 经 常用 C 或 者 Fortran 生成 模拟 
数据 ，C 语言 用 于 控制 实验 设备 。 生 物 学 家 使 用 Perl 处 理 DNA 序列 数据 。 数 据 分 析 使 用 其 他 
软件 包 ， 例 如 用 MATLAB 或 者 Mathematica 来 求解 方程 式 ， 用 Stata, SPSS 或 者 R 实现 统计 
分 析 ， 而 数据 可 视 化 又 采用 了 其 他 软件 ， 这 样 使 得 科研 编程 工具 变化 很 大 。 

这 样 一 个 工具 的 大 杂烩 不 管 从 哪个 方面 来 看 都 不 是 一 个 好 方案 。 从 计算 角度 ， 工 具 之 间 
无 法 实现 相互 传递 数据 ， 造 成 过 多 的 手工 操作 或 者 额外 的 胶水 代码 ， 然 而 科学 家 并 未 就 此 接 
受过 培训 。 而 且 重 要 的 是 ， 将 这 些 工 具 粘 合 在 一 起 对 科学 家 的 数据 管理 工作 是 一 个 极 大 的 负 
担 。 在 如 此 复杂 的 系统 中 ， 经 常会 在 不 同 的 场合 产生 过 多 的 不 同 格式 的 数据 文件 。 多 数 工 具 
没有 生成 这 些 文件 的 元 数据 ， 科 学 家 通常 忙于 文件 的 命名 方案 解读 ， 借 此 找 出 文件 中 包含 什 
么 类 型 的 数据 以 及 它们 是 如 何 生成 的 。 如 此 的 复杂 性 很 容易 导致 错误 。 这 可 能 将 最 好 的 数据 
转变 成 差 的 来 源 ， 事 实 上 ， 科 学 研究 中 的 数据 完整 性 是 每 个 结论 的 基础 。 

而 且 ， 当 手工 将 数据 文件 从 一 个 工具 移植 到 另外 一 个 数据 工具 时 如 果 出 错 ， 而 且 难 以 确 
定 错误 是 因为 程序 导致 还 是 人 为 用 错 文件 所 致 。 在 后 续 的 工作 中 只 能 通过 手工 记录 在 纸 上 或 
者 电子 实验 记事 本 上 的 方式 进行 重复 分 析 。 这 种 实践 很 容易 被 忘记 ， 或 者 很 难 传 给 后 续 科 学 
家 ， 同 行 也 无 法 再 现 科 研 结 果 。 

Python 编程 语言 及 其 相关 社区 工具 提供 了 一 个 综合 的 科学 编程 平台 ， 可 以 帮助 科学 家 们 
解决 上 述 问题 。 这 个 综合 平台 使 科学 家 能 够 在 同一 计算 框架 内 生成 、 分 析 、 可 视 化 和 管理 他 
们 的 数据 。 Python 可 以 用 于 生成 模拟 数据 或 控制 仪表 来 捕获 数据 。 Python 也 可 用 于 完成 数据 
分 析 ， 并 且 Python 拥有 图 形 库 可 以 产生 科学 图 表 和 图 形 。 此 外 ，Python 代码 可 用 于 将 所 有 的 
Python 解决 方案 胶合 在 一 起 ， 所 以 可 视 化 代码 可 以 与 产生 数据 的 代码 相 邻 。 这 将 简化 数据 的 
生成 和 分 析 ， 使 得 数据 管理 切实 可 行 。 最 重要 的 是 ， 这 个 统一 的 工具 集 允许 科学 家 在 Python 
代码 中 记录 数据 处 理工 作 的 步骤 ， 允 许 自动 跟踪 起 源 。 
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附录 E 


无 处 不 在 的 Python 


附录 


除了 以 集成 包 形 式 发 布 的 Python 软件 , 还 有 大 量 第 三 方 软件 。 这些 Python 软件 涵盖 了 各 
个 领域 。Python 在 图 形 绘制 (Matplotlib 、gnuplot)、 科 学 计算 〈 例 如 NumPy、SciPy、SymPy)、 


E 


数据 库 、XML、 网 络 (TCP/IP, Web). GUI. KAP (OpenCV, IPL, VTK, ITK) 方面 


域 中 的 一 些 著名 Python 应 用 与 Python 包 。 


在 大 数据 处 理 方 面 除了 第 12 章 提 及 的 PyTables. pandas, JSON 等 内 容 ，Python 还 有 


均 有 相应 的 支持 。 同 时 Python 在 许多 科学 研究 领域 也 有 相应 的 软件 。 下 面 给 出 在 多 个 科学 领 


其 


AN 


他 方向 的 工具 ，http:/www.xmindnetm/WvfC/ 给 出 了 Python 在 大 数据 处 理 方面 的 各 种 优秀 软 


件 包 ， 如 图 E-1 所 示 。 


306866) © PyPI Aal 


Cython e| 效率 | 
ipcluster = ipython @ 
pp @ | 并 行 | 
dispy 
NumbaPro GPU | 
PyCUDA | | 
R - rpy2 @ 
Spark - PySpark 
R 
SQL 
Q |= magic ipython | 胶水 | 
matlab/octave | —— —— : i 
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Java - Jython 
Amazon Web Services = boto 
Hadoopy 
example @ 
|- Hadoop Streaming 
dumbo |— — — — — — —^- Hadoop 接 口 
- | s| MapReduce | 
mrjob E 
uses Hadoop Pipes = Pydoop 
disco 9 E 


图 E-1 


jme j 


大 数据 的 Python | 


| 数据 格式 | 


EACH 


Python 大 数据 处 到 


numpy 


scipy 
pandas - 


scikits image 


scikits learn 


scikits statsmodels 


nitk 


matplotlib 
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| 较 新 包 H wiseRF 


| Blaze 


Anaconda 
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— Wakari 
i Python + AWS 
| 集成 平台 [e+ Picloud e Python +AWS 


wiseio = MLaas = RandomForest 


| ipython Notebook 


Orange 


matplotlib 


Bokeh - ggplot for python 
Mayavi 


Nodebox 


| 可视化 上 | 
EE igraph 


pandas pandas.tools.rplot 


Google APIs =  googleVis 


xreadlines 


readLines 


Flat text = | 


read_csv 
pandas 


一 一 一 | read_fwf 


xlrd/xlwt/xlutils @ 


SQLAlchemy @ 
| pysqlite3 
SQL | Vertica 
| pyodbc -| Netezza 
Teradata 
MongoDB - PyMongo 


NoSQL - couchdb-python @ 
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标准 库 json 
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XML - 标准 库 xml 
HBase HappyBase 


Fel 


253 


Python Fp 4 Pp Jf] 


下 面 是 在 一 些 科学 领域 成 功 应 用 的 软件 包 : 


县 软件 ， 可 Hj 


牛 结构 。 可 处 理 


F 分 析 Blast. 


NetworkX (http:/networkx.github.io/) 是 一 个 用 Python 开发 的 图 


R, WETA 


使 用 。 


OpenStack 是 用 


建 模 等 工作 。NetworkX 被 数学 家 、 物理 


Python 


软件 的 开源 项 目 。 
ChiantiPy 是 一 个 基于 Python 接口 的 天 体 物理 光谱 学 的 CHIANTI 原子 数据 库 。 


CHIANTI 天 体 物理 


Biopython 〈http:/biopython.org/wiki/Biopython ) 是 一 款 优秀 的 、 被 广泛 使 有 
Clustalw, FASTA, GenBank, UniGene, SwissProt 等 文 
在 线 生物 信息 , 例如 NCBI (支持 Blast, Entrez # 


发 的 云 平 台 ， 是 一 个 肯 在 为 公共 及 私有 


光谱 原子 数据 库 提 供 了 必要 的 信息 来 计 


会 学 


家 所 


的 生物 信 


Il PubMed) 和 ExPASy. 
论 与 复杂 网 络 建 模 工 


用 的 图 与 复杂 网 络 分 析 算 法 ， 可 以 方便 地 进行 复杂 网 络 数据 分 析 、 仿 真 
学 家 、 生 物 学 家 、 计 算 机 学 者 和 和 牢 


云 的 建设 与 


ChiantiPy 提供 几 个 顶级 类 访问 数据 库 ， 并 计算 射线 强度 。 


ARCPy 是 一 个 关于 GIS 的 包 , 包含 对 地 图 操作 和 地 图 代数 的 支持 ， 文 持 编辑 处 至 


热 等 离子 体 发 射 ; 


管理 提供 


何 操作 ， 可 以 在 ArcGIS 中 访问 Python. 


stsci python Chttp://www.stsci.edu/institute/software hardware/pyraf/stsci python) 


v" 


ERUL 


Eo. 
是 一 个 


用 于 分 析 天 文 数据 的 库 , 使 用 Python 和 C 扩展 编写 , 包含 PyRAF、 DrizzlePac、 PyFITS、 
Numdisplay, PyRAF 软件 。 
Epigrass 是 一 球 流行 病 分 析 与 模拟 软件 。 


PsychoPy (http:/www.psychopy.org/) 是 一 款 心理 学 软件 ， 可 用 于 神经 科学 、 心 理 
心理 物理 学 试验 的 数据 处 理 。 


` 


学 、 


GRIB 是 世界 气象 组 织 制 定 的 网 格 数据 格式 ， 被 气象 中 心 用 于 网 格 数据 的 储存 与 交 
换 。pygrib Chttps;//pypi.python.org/pypi/pygrib/1.9.6) 与 pyNIO Chttps://www.pyng Lucar.edu/ 


Nio.shtml) 可 用 于 解释 GRIB 数据 。 


GNU Radio 是 用 


设计 完全 公 


o 


Python 


发 的 无 线 电 软件 ， 运 行 于 普通 的 PC 上 


在 下 面 的 网 站 可 看 到 不 同 技术 领域 使 用 的 Python 包 以 及 成 功 案例 。 


€ http;//www.lfd.uci.edu/-gohlke/pythonlibs/Z5 H 


€ https://pypi.python.org/pypi 根据 应 用 领域 给 出 了 许多 软件 包 。 
€ https://www.python.org/about/success/ 给 出 各 个 领域 的 成 功 案例 。 


€ http://www.chempython.org/applications.html £5 H 


H f Python 在 化 学 方面 的 应 


I 


， 其 软件 代码 和 硬件 


H— Python 安装 包 信 息 。 


情况， 包 


括 化 学 信息 学 (Cambios Toolkit、Frowns、PyDaylight)、 分子 模型 (Molecular Modelling 
Tool Kit MMTK. Class Library for Advanced Molecular Properties、MDTools for Python) 
和 分 子 可 视 化 (Chimera、PyMol、Python Molecular Viewer PMV, VMD). 
€ http:/www.atnf.csiro.au/people/Enno.Middelberg/python/python.html 提供 了 天 文学 方面 


的 Python 包 。 


e 国内 的 http:/www.pythoner.cn/home/blog/astronomy-related-python-resources/ 网 址 提供 了 
KEH Python 天 文学 应 用 。 
€ http://svaksha.github.io/pythonidae/ 给 出 了 一 些 Python TESEYA. 4 
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E 物 信息 学 、 


7 


其 


因 


组 


附录 


学 、 农 业 、 食 品 科学 、 医 学 、 基 因 工 程 、 神 经 科学 、 分 析 化 学 、 化 学 信息 学 、 唱 体 
学 、 纳 米 化 学 、 核 化 学 、 数 据 库 、 图 形 可 视 化 、 气 候 学 、 地 球 化 学 、 地理 学、 地 理 信 
息 技 术 、 地 质 、 地 球 物理 、 数 学 、 气 象 学 、 海 洋 学 ， 数 据 挖 据 、 数 据 结 构 、 机 器 学 
习 、 认 知 科学 、 语 言 学 、 分 布 式 和 并 行 计 算 、 云 计算 ， 集 群 计算 、 网 格 计算 、 编程 范 
式 等 领域 的 应 用 。 
https://en.wikipedia.org/wiki/List of Python software 列 出 了 Python 软件 应 用 情况 。 包 括 
成 功 应 用 案例 ，Web 领域 应 用 ， 现 有 的 基于 Python 的 Web 框架 、 图 形 框 架 、UI 框架 ， 
科学 应 用 (Astropy、Biopython、graph-tool、Pathomx、NetworkX、SciPy、scikit-learn、 
scikit-image, SymPy, TomoPy, Veusz, VisTrails) 以 及 成 功 的 Python 商业 应 用 。 


255 


Python 
即 学 即 用 


ALIE I 


本 书 从 易 用 性 角度 介绍 了 Python 编程 ， 分 为 Python 基本 内 容 和 高 级 话题 两 大 部 分 。 
其 中 ， 基 本 内 容 主 要 包括 Python 数据 类 型 、 控 制 流程 、 文 件 、 类 、 模 块 、 网 络 编程 、 正 则 
表达 式 、GUI 和 数据 库 访问 等 ; 在 每 一 章 的 基本 内 容 基 础 上 加 以 延伸 ， 引 出 对 应 的 高 级 话 
题 ， 分 别 介 绍 了 Matplotlib. NumPy, SciPy, Flask, PyQt, ORM 等 优秀 的 Python 软件 包 。 

后 介绍 了 大 数据 常用 工具 (JSON, XML, HDF5, pandas). 

本 书 是 以 即 学 即 用 的 方式 进行 讲解 的 ， 读 者 可 在 每 章 后 应 用 该 章 的 知识 解决 实 
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